Как синхронизировать raid диски

Обновлено: 07.07.2024

В этой статье я обзорно расскажу о возможностях по организации RAID массивов встроенными средствами Windows Server и подробно о том, какие подводные камни могут встретиться при создании и эксплуатации таких массивов.

Возможности программного RAID в Windows Server

Поддерживаются следующие массивы:

  • чередующийся том (striped volume, RAID0)
  • зеркальный том (mirrored volume, RAID1)
  • том RAID5 (RAID5 volume)
  • охватывающий том (spanned volume, один логический том размещается более чем на одном физическом диске)

Динамические диски

Массивы RAID можно создавать только на динамических дисках — особая разметка физических дисков (понятная только Windows), которая обладает следующими особенностями:

  • Обычный (базовый) диск можно преобразовать в динамический только целиком.
  • Обратное преобразование динамического диска в базовый возможно, но только если с динамического диска удалить все тома.
  • Динамический диск представляет собой один большой NTFS раздел, на котором с помощью хитрой служебной информации может размещаться большое количество томов (как простых, так и RAID), имеется возможность изменять размеры простых томов штатными средствами Windows. Однако, насколько оптимально и фрагментировано будут размещаться данные, мне не известно.
  • Известные мне программы клонирования, восстановления и изменения размеров дисков не поддерживают динамические диски.
  • Динамические диски, содержащие RAID-тома, могут быть перенесены на другой компьютер с Windows Server, так как содержат необходимую информацию для правильной сборки массива.

Невозможно создать тома с разными уровнями RAID

На одной группе физических дисков можно создавать тома RAID только одного типа (уровня). Например, если у нас есть 3 физических диска, и мы создали на них том RAID5, не занимая всего пространства. Мы не сможем в свободном пространстве создавать тома другого уровня RAID (RAID0 и RAID1), а только RAID5 и простые тома.

Одновременная синхронизация томов

Если на одной группе дисков создано несколько томов RAID, то в случае какого-либо сбоя после загрузки компьютера они начинают восстанавливаться одновременно. Это лютый, бешеный EPIC FAIL! Простая ситуация: имеется два физических диска, на них создано два RAID1 тома, один под операционную систему, другой под данные.

Со стороны такая «отказоустойчивость» выглядит следующим образом: общее быстродействие дисковой подсистемы падает раз в 20, сама ОС загрузится либо после окончания синхронизации одного из томов (минут 15, если он небольшой, гиг на 50), либо минут через 20 и будет бесполезна до конца синхронизации одного из томов.

Вышеописанное поведение я считаю недопустимым архитектурным просчетом со стороны Microsoft и удивлен тем, что эта беда не решена до сих пор со времен появления программного RAID в Windows 2000 Server.

Если вы попали в описанную ситуацию, то не стоит дожидаться загрузки ОС и изнашивания дисков.

  1. Отключаете один из физических дисков.
  2. Загружаетесь в ОС с нормальной скоростью.
  3. Разбиваете зеркало, превратив тома RAID1 в простые.
  4. Подключаете обратно второй диск.
  5. Создаете только одно зеркало для необходимого вам тома.

RAID5

Опишу сценарий, при котором вы не сможете восстановить деградировавший массив RAID5 до здорового состояния, даже если для этого предоставлены все условия.

  1. Имеется массив RAID5 из шести дисков (Диск1-Диск6).
  2. Среди них есть один сбойный Диск1 (например, из терабайтного объёма пара мегабайт не читаются), но операционная система об этом еще не знает и как сбойный его не отметила.
  3. По каким-либо причинам от массива был отключен исправный Диск2.
  4. Следуя логике RAID5, при отказе одного диска работоспособность массива сохраняется, такой массив помечается как деградировавший (degraded), скорость его работы резко падает, требуется синхронизация с новым исправным диском.
  5. Исправный Диск2 подключается на место. Система его опознает как сбойный. Чтобы синхронизировать массив, этот сбойный диск нужно удалить из массива RAID5 и определить как пустой.
  6. Все готово для синхронизации массива. Запускаем исправление массива (repair) на пустой Диск2.
  7. ВНЕЗАПНО синхронизация натыкается на ошибки чтения на действительно неисправном диске Диск1 и останавливается.
  8. Весть массив остается деградированным. Диск1 помечен как содержащий ошибки (errors), Диск2 помечен как online, однако из-за прерванной синхронизации не содержит полных корректных данных.
  9. В надежде на восстановление подключается совершенно новый исправный Диск7. Запускается восстановление массива на него.
  10. В результате исправный Диск2 заменяется на другой исправный Диск7, но синхронизация снова прерывается, найдя ошибку на неисправном диске Диск1.
  11. И так далее по циклу.

Ничего сделать, кроме как скопировать еще читающиеся данные и пересобрать весь массив нельзя.

Не желая признавать поражения, я пытался сделать следующие вещи:

  • Синхронизировать массив с пропуском ошибок чтения на диске Диск1 (ведь это всего лишь мегабайты их целого терабайта). Но Microsoft не дает такой возможности.
  • Посекторно переписать весь сбойный Диск1 на другой здоровый диск с помощью программ для клонирования. Однако, доступные мне программы с динамическими дисками не работали.

Пример грамотной реализации программного RAID

От перечисленных выше недостатков избавлена аппаратно-программная реализация RAID-контроллера, известная как Intel Matrix Storage, и недавно переименованная в Intel Rapid Storage (работает на RAID-версиях чипсетов, таких как ICH9R, ICH10R). Аппаратно-программный RAID от Intel обеспечивает многие преимущества «врослых» RAID-контроллеров:

  • возможность определить диски горячей замены
  • возможность создавать тома разного уровня RAID на одной группе дисков
  • последовательная синхронизация и проверка RAID томов на группе дисков

Основным ее недостатком, в отличии от полностью аппаратных RAID-контроллеров, остается «программность», из которой вытекают:

  • отсутствие встроенного кеша и возможности автономной работы в случае аварии
  • полностью зависит от операционной системы и драйверов
  • выполняемые операции на дисковой подсистеме нагружают основной процессор и память
  • отсутствует поддержка продвинутых вычислительно емких уровней RAID, таких как RAID6

Полезные ссылки

    — Windows IT Pro [довольно старая статья] — Хакер [читать осторожно, «вся» правда перемешана с небылицами]

9 комментариев

Спасибо, было интересно почитать.
А насколько у вас большой опыт использования ICH10R ? p.s. уведомлений на комментарии нет?

Статья очень заинтересовала посколько сам использую софт рейд. Если материнская плата не запускается насколько сложно восстановить информацию?

В случае зеркала из одного тома на весь диск, полностью согласен. Но если на динамическом диске создавались несколько томов, а потом еще их размер динамическим менялся средствами Win Disk Mgmt, то такая каша получается, что HEX редактором разбираться даже не хочется пробовать.

Доброго времени суток!

Установлена Windows Server 2003 R2 SP1 Rus. В данной системе изначально было установлено 4 жестких диска SATA. Из них соответственно было собрано 2 программных зеркала средствами самого Windows. Все жесткие диски - динамические.

Первое зеркало содержит систему и установленные программы.

Второе зеркало содержит различные данные.

В ходе эксплуатации сервера во втором зеркале вышел из строя жесткий диск. Соответственно пришлось разобрать зеркало. К сожалению найти точно такой же жесткий диск не удалось. Поэтому купили 2 новых диска.

Сначала подключили к системе 1 новый диск и попробовали сделать синхронизацию данных со старого диска на новый. Увы в процессе синхронизации Windows обнаружила несколько bad-блоков и прервала процесс синхронизации. Таким образом, второе зеркало по-прежнему остается разваленным.

Подскажите, возможно ли все-таки средствами Windows синхронизировать данные. И если нет, то какие варианты порекомендуете?

Ответы

Доброго времени суток!

Установлена Windows Server 2003 R2 SP1 Rus. В данной системе изначально было установлено 4 жестких диска SATA. Из них соответственно было собрано 2 программных зеркала средствами самого Windows. Все жесткие диски - динамические.

Первое зеркало содержит систему и установленные программы.

Второе зеркало содержит различные данные.

В ходе эксплуатации сервера во втором зеркале вышел из строя жесткий диск. Соответственно пришлось разобрать зеркало. К сожалению найти точно такой же жесткий диск не удалось. Поэтому купили 2 новых диска.

Сначала подключили к системе 1 новый диск и попробовали сделать синхронизацию данных со старого диска на новый. Увы в процессе синхронизации Windows обнаружила несколько bad-блоков и прервала процесс синхронизации. Таким образом, второе зеркало по-прежнему остается разваленным.

Подскажите, возможно ли все-таки средствами Windows синхронизировать данные. И если нет, то какие варианты порекомендуете?

Сделать резервную копию, создать зеркало, восстановить резервную копию на зеркало.

У меня есть два диска по 500 ГБ, и вчера я отразил первый диск на второй, используя программный RAID 1.

ПК был включен в течение 30 часов. На обоих дисках написано «Resynching», но индикатор прогресса отсутствует. Кроме того, на обоих дисках есть маленький желтый восклицательный знак.

  • Сколько времени может занять синхронизация для 500 ГБ диска с 150 ГБ данных? ПК имеет 4 ГБ оперативной памяти и двухъядерный процессор AMD 4000+
  • Есть ли способ контролировать состояние синхронизации?
  • Как я могу проверить, что означает восклицательный знак?

Вот как вы можете получить процент / статус обратно:

Выберите один из raid-дисков в разделе «Управление дисками». Затем справа (с Windows 7 Professional) у меня есть опция «Дополнительные действия», когда я нажимаю, что появляется новое меню с опцией: Обновить.

Этим действием я вернул процент, он все еще на 4%, хотя здесь: P. Удачи

Или вы можете просто подождать. Я считаю, что синхронизация должна длиться 15-30 минут, прежде чем она даст вам завершенный процент. В Windows 10 эта опция отсутствует, но вы можете нажать F5, чтобы запросить обновление, процент должен отображаться ПОСЛЕ нескольких секунд. @EricGrange просто хочу, чтобы вы знали, что у меня Windows 10 Pro, и я вижу вариант - но мне нужно развернуть Управление дисками на боковой панели в разделе «Действия». Если вы не видите «Действия», вам может потребоваться нажать «Вид»> «Настроить» и поставить галочку рядом с панелью «Действия».

Вот резюме для тех, кто ищет в этой теме и имеет проблемы по этой проблеме.

Вы можете уйти на месяцы, годы, прежде чем произойдет повторная синхронизация, если вам повезет. Любая реализация RAID потенциально пострадает от этой обратной синхронизации. Это произойдет независимо от того, будет ли HW или SW raid, но эти примечания относятся конкретно к программному RAID-массиву XP / Vista / W7. В W7 зеркалирование даст более высокую производительность, чем отдельный диск, но повторная синхронизация может быть выполнена лучше.

Raid 1, зеркальный набор, всегда должен будет повторно синхронизироваться после любого необычного выключения системы. Если нужно нажать кнопку питания, потому что система полностью заблокирована, или она отключается из-за сбоя питания, тогда при следующем запуске будет произведена повторная синхронизация Raid 1. (Существуют предположения, что Центр обновления Windows может вызвать повторную синхронизацию, применяя обновления только к одному диску из набора. Это может быть или не быть правдой.)

Повторная синхронизация применяется ко всему диску, а не только к одному разделу или используемой части.

Windows 7 (всегда можно надеяться, что в W8 все может быть по-другому) синхронизируется примерно с 10% нормальной скорости диска. У меня есть диски 80 МБ / с, но они синхронизируются со скоростью около 7 МБ / с. Любая активность на зеркальном наборе замедлит ход событий.

Если у вас есть возможность перезагрузить систему до завершения повторной синхронизации, она начнется заново.

Прогресс% -age не будет отображаться в течение некоторого времени. Нажатие F5 с активным окном управления должно в конечном итоге вызвать его, но вы можете подождать около часа, прежде чем это сработает.

Используя среднее из шестого шага и размер диска, теперь вы можете предсказать общее время до того, как набор зеркал будет равен 100%. Например, у меня установлено зеркало размером 1,5 ТБ, и я нахожу, что мое среднее обновление составляет около 7 МБ / с, что дает ETA 60 часов. Я считаю, что это довольно точно. Я не занимаюсь редактированием фотографий или видео в промежутке, что немного неприятно, но работа будет очень
вялой и задержит ETA.

Я надеюсь, что это успокаивает людей, которые столкнулись с этой проблемой. Это время будет увеличиваться по мере увеличения количества дисков, и я хотел бы, чтобы MS сделала несколько вещей: во-первых, используйте некоторый адаптивный алгоритм, чтобы обеспечить более быстрое использование скорости дисков, особенно позволяя повысить приоритет, когда система не используется. было бы больше похоже на 5 или 6 часов, если бы можно было использовать полную скорость ввода-вывода; во-вторых, отслеживайте повторную синхронизацию секторов, чтобы можно было перезапустить их при необходимости по другим причинам.

Привет, друзья. В прошлой статье мы с вами создали RAID 1 массив (Зеркало) - отказоустойчивый массив из двух жёстких дисков SSD. Смысл создания RAID 1 массива заключается в повышении надёжности хранения данных на компьютере. Когда два жёстких диска объединены в одно хранилище, информация на обоих дисках записывается параллельно (зеркалируется). Диски являются точными копиями друг друга, и если один из них выйдет из строя, мы получим доступ к операционной системе и нашим данным, ибо их целостность будет обеспечена работой другого диска. Также конфигурация RAID 1 повышает производительность при чтении данных, так как считывание происходит с двух дисков. В этой же статье мы рассмотрим, как восстановить массив RAID 1, если он развалится. Другими словами, мы рассмотрим, как сделать Rebuild RAID 1.

↑ Восстановление (Rebuild) RAID 1 массива



Развал RAID 1 массива может произойти по нескольким причинам: отказ одного из дисков, ошибки микропрограммы БИОСа, неправильные действия пользователя компьютера. При развале RAID 1 в БИОСе у него будет статус "Degraded".


В таких случаях нужно произвести восстановление (Rebuild) массива. Каким образом это можно сделать? К примеру, при отказе одного накопителя мы просто подсоединяем другой исправный, затем жмём в БИОСе кнопку "Rebuild", и происходит синхронизация данных на дисках. Таким вот образом RAID 1 массив восстанавливается, и мы можем работать дальше. Вроде, всё просто. Однако на практике при возникновении такой проблемы много нюансов. Давайте подробно рассмотрим все особенности восстановления RAID.

↑ Мониторинг состояния жёстких дисков в RAID

Если созданный с помощью БИОСа материнской платы RAID 1 массив развалился, неопытный пользователь может этого сразу и не понять. Мы не получим ни звукового оповещения, ни оповещения в иной форме, сигнализирующих о проблеме развала RAID 1. Возможностями аварийной сигнализации при развале массивов обладают только отдельные SAS/SATA/RAID-контроллеры, работающие через интерфейс PCI Express. За аварийную сигнализацию при проблемах с массивами отвечает специальное ПО таких контроллеров. Не имея таких контроллеров, можем использовать программы типа CrystalDiskInfo или Hard Disk Sentinel Pro, которые предупредят нас о выходе из строя одного из накопителей массива звуковым сигналом, либо электронным письмом на почту.


Если заглянем в управление дисками Windows, о развале RAID 1 можем догадаться, например, по исчезновению разметки одного из дисков.

Для примера возьмём мою материнскую плату на чипсете Z490 от Intel, для которого существует специальное программное обеспечение Intel Rapid Storage Technology (Intel RST). Технология Intel Rapid Storage поддерживает SSD SATA и SSD PCIe M.2 NVMe, повышает производительность компьютеров с SSD-накопителями за счёт собственных разработок. Всесторонне о бслуживает массивы RAID в конфигурациях 0, 1, 5, 10. П редоставляет пользовательский интерфейс Intel Optane Memory and Storage Management для управления системой хранения данных, в том числе дисковых массивов .



После установки Intel RST в главном окне увидим созданный нами из двух SSD M.2 NVMe Samsung 970 EVO Plus (250 Гб) RAID 1 массив, исправно функционирующий.


Вот этот массив в управлении дисками Windows.


И в диспетчере устройств.


Технология Intel Rapid Storage имеет свою службу и постоянно мониторит состояние накопителей. На данный момент все находящиеся в рейде диски исправны.


Если какой-либо накопитель неисправен, драйвер Intel RST сразу предупредит всплывающим окном о проблеме «Требуется внимание. Производительность одного из ваших томов снижена».


И в главном окне программы будет значиться, что один из дисков массива неисправен.


В этом случае можно произвести диагностику неисправного накопителя специальным софтом, к примеру, программой Hard Disk Sentinel Pro . Если диск неисправен или отработал свой ресурс, выключаем компьютер и заменяем диск на новый. Затем делаем Rebuild (восстановление) RAID 1 массива.

↑ Rebuild (восстановление) RAID 1 массива

После замены неисправного диска включаем ПК и входим в БИОС. Заходим в расширенные настройки «Advanced Mode», идём во вкладку «Advanced». Переходим в пункт «Intel Rapid Storage Technology».



Видим, что наш RAID 1 массив с названием Volume 1 неработоспособен - "Volume 1 RAID 1 (mirroring), Degraded".Выбираем "Rebuild" (Восстановить).

Обратим внимание на уведомление внизу: "Selecting a disk initiates a rebuild. Rebuild completes in the operating system", переводится как "Выбор диска инициирует перестройку массива. Восстановление завершается в операционной системе". Выбираем новый накопитель, который нужно добавить в массив для его восстановления, жмём Enter. Появится следующий экран, указывающий, что после входа в операционную систему будет выполнено автоматическое восстановление - "All disk data will be lost", переводится как "Все данные на диске будут потеряны".RAID 1 массив восстановлен.


Жмём F10, сохраняем настройки, произведённые нами в БИОСе, и перезагружаемся.

После перезагрузки открываем программу Intel Optane Memory and Storage Management и видим, что всё ещё происходит перестроение массива, но операционной системой уже можно пользоваться.


↑ Rebuild (восстановление) RAID 1 массива в пользовательском интерфейсе Intel Optane Memory and Storage Management

Восстановить дисковый массив можно непосредственно в программе Intel Optane Memory and Storage Management. К примеру, у нас неисправен один диск массива, и Windows 10 загружается с исправного накопителя. Выключаем компьютер, отсоединяем неисправный, а затем устанавливаем новый SSD PCIe M.2 NVMe, включаем ПК. Программа Intel Optane Memory and Storage Management определяет его как неизвестный жёсткий диск.

Диспетчер устройств, как и управление дисками, не видит целостный RAID, а видит два разных SSD.


В главном окне программы жмём «Создать том RAID».


У нас SSD нового поколения с интерфейсом PCIe M.2 NVMe, значит, выбираем контроллер PCIe. Тип дискового массива - "Защита данных в режиме реального времени (RAID 1)".


Выбираем два наших диска SSD PCIe M.2 NVMe.

Если на новом диске были данные, после перестроения массива данные на нём удалятся. Жмём "Создать том RAID". Можем наблюдать процесс восстановления массива.


RAID 1 массив восстановлен.




↑ Автоматический Rebuild RAID 1 массива

Если включить в настройках программы Intel RST «Автоматическое перестроение при оперативной замене», при замене неисправного накопителя не нужно будет ничего настраивать. Восстановление дискового массива начнётся автоматически.


↑ Восстановление массива RAID 1 из резервной копии при замене двух вышедших из строя дисков

Если у вас выйдут из строя сразу оба накопителя, то покупаем новые, устанавливаем в системный блок, затем создаём RAID 1 заново и разворачиваем на него резервную копию.

Читайте также: