Этот класс устройств используется как массив недорогих независимых дисков с избыточностью

Обновлено: 06.07.2024

Описание слайда:

2
ТЕХНОЛОГИЯ RAID:
RAID (Redundant Arrays of Inexpensive Disks) - избыточный массив независимых дисков - технология виртуализации данных, которая объединяет несколько дисков в логический элемент для избыточности и повышения производительности.

Аббревиатура «RAID» изначально расшифровывалась как «Redundant Array of Inexpensive Disks» («избыточный (резервный) массив недорогих дисков», поскольку они были гораздо дешевле дисков SLED (Single Large Expensive Drive)).

Со временем «RAID» стали расшифровывать как «Redundant Array of Independent Disks» («избыточный (резервный) массив независимых дисков»), поскольку для массивов приходилось использовать и дорогое оборудование (под недорогими дисками подразумевались диски для ПЭВМ).

Описание слайда:

ТЕХНОЛОГИЯ RAID:
3
Дэвид Петтерсон
(David A. Patterson)
Гэрт Гибсон
(Garth A. Gibson)
Ренди Катц
(Randy H. Katz)
Первый RAID был представлен в 1987 году.
Создатели:

Описание слайда:

ТЕХНОЛОГИЯ RAID:
Цели использования технологии RAID:

Улучшения производительности.
Повышения отказоустойчивости.
Улучшения производительности и повышения отказоустойчивости.

Методы записи и защиты информации в основе технологии RAID :

Поочередное размещение.
Зеркальное отображение дисков.
Вычисление контрольных сумм.

Основные принципы технологии RAID:

Массив (Array).
Зеркалирование (Mirroring).
Дуплекс (Duplexing).
Чередование (Striping).
Четность (Parity).
4

Описание слайда:

5
Массивом (физическим) называют несколько накопителей, которые централизованно настраиваются, форматируются и управляются.

Логический массив – это более высокий уровень представления, на котором не учитываются физические характеристики системы.
ТЕХНОЛОГИЯ RAID. МАССИВ:
Логические диски могут по количеству и объему не совпадать с физическими.

Описание слайда:

ТЕХНОЛОГИЯ RAID. ЗЕРКАЛИРОВАНИЕ:
Зеркалирование – технология, позволяющая повысить надежность системы за счет одновременной записи данных на два жестких диска. То есть посредством создания «зеркала» данных. При выходе из строя одного из дисков вся информация остается сохраненной на втором. За такую стопроцентную защиту приходится платить: один жесткий диск работает, не увеличивая доступную емкость. При этом отсутствует выигрыш в производительности.
6

Описание слайда:

ТЕХНОЛОГИЯ RAID. ДУПЛЕКС:
Дуплекс – развитие идеи зеркалирования. В этом случае высокий уровень надежности достигается за счет в два раза большего количество жестких дисков, при этом появляются дополнительные затраты ну установку двух независимых RAID-контроллеров. Выход из строя одного диска или контроллера не сказывается на работоспособности системы. Столь дорогое решение используется только во внешних RAID-массивах, предназначенных для ответственных приложений.
7

Описание слайда:

ТЕХНОЛОГИЯ RAID. ЧЕРЕДОВАНИЕ:
Чередование – согласно данной технологии запись ведется на несколько жестких дисков, при этом записываемый файл разбивается на части определенного размера и посылается на несколько накопителей. Файлы хранятся в фрагментированном виде.

Данная технология позволяет увеличить линейную скорость записи-чтения. Основной же проблемой становится надежность, поскольку выход из строя любого накопителя приводит к потере информации.

Описание слайда:

Четность является альтернативным решением, которое соединяет в себе достоинства и недостатки зеркалирования и чередования, используется тот же принцип, что и в избыточных кодах, основанных на свертке по модулю 2.

Согласно данной технологии используется n+1 накопитель, при этом на n накопителей записывается информация в виде отдельных блоков (как в чередовании). На n+1 диске хранится так называемый экстраблок, который является контрольной соответствующих n блоков.

Плюсы четности очевидны. За счет использования чередования повышается скорость работы. За счет использования экстраблоков повышается надежность, но при этом «нерабочий» объем массива достаточно мал и одинаков при любом количестве дисков – составляет емкость диска, то есть при 5 дисках в массиве «теряется» всего 20% емкости

Основным недостатком является необходимость выполнения вычислений налету. В идеальном варианте вычисления должны выполняться RAID-контроллером.
ТЕХНОЛОГИЯ RAID. ЧЕТНОСТЬ:
9

Описание слайда:

RAID-МАССИВЫ. УРОВНИ:
Номера уровней не связаны с характеристиками RAID, а попросту соответствуют порядку, в котором были предложены различные варианты.
Уровни спецификации RAID, принятые как стандарт де-факто:

RAID 1 - зеркальный дисковый массив;
RAID 2 - массивы, которые применяют код Хемминга;
RAID 3 и RAID 4 - дисковые массивы с чередованием и выделенным диском чётности;
RAID 5 - дисковый массив с чередованием и отсутствием выделенного диска чётности.
Калифорнийский университет в Беркли
10

Описание слайда:

Дополнительные уровни спецификации RAID:

RAID 0 - дисковый массив повышенной производительности с чередованием, без отказоустойчивости. Строго говоря, RAID-массивом не является, поскольку избыточность (redundancy) в нём отсутствует;
RAID 6 - дисковый массив с чередованием, использующий две контрольные суммы, вычисляемые двумя независимыми способами;
RAID 10 - массив RAID 0, построенный из массивов RAID 1;
RAID 01 - массив RAID 1, построенный из массивов RAID 0 (имеет низкую отказоустойчивость);
RAID 1E (зеркало из трёх устройств), RAID 50 (массив RAID 0 из массивов RAID 5), RAID 05 (RAID 5 из RAID 0), RAID 60 (RAID 0 из RAID 6) и различные другие
RAID-МАССИВЫ. УРОВНИ:
11

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 0:
RAID 0 (Non-Redundant Striped Array) - дисковый массив из двух или более жёстких дисков без резервирования. Информация разбивается на блоки данных A_фиксированной длины и записывается на оба/несколько дисков поочередно, то есть один блок на первый диск, а второй блок на второй диск соответственно.
Преимущества:
Скорость считывания файлов увеличивается в n раз, где n - количество дисков. При этом оптимальная производительность достигается только для больших запросов, когда фрагменты файла находятся на каждом из дисков.

Недостатки:
Увеличивается вероятность потери данных: если вероятность отказа 1 диска равна p, то вероятность выхода из строя массива RAID 0 из двух дисков равна 2p-p*p.
12

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 1:
RAID 1 (Mirrored Arrays) - массив из двух (или более) дисков, являющихся полными копиями друг друга. Не следует путать с массивами RAID 1+0 (RAID 10), RAID 0+1 (RAID 01), в которых используются более сложные механизмы зеркалирования.
Преимущества:
Приемлемая скорость записи (такая же, как и без дублирования) и выигрыш по скорости чтения при распараллеливании запросов.
Высокая надёжность - работает до тех пор, пока функционирует хотя бы один диск в массиве. Вероятность выхода из строя сразу двух дисков равна произведению вероятностей отказа каждого диска.

Недостатки:
По цене двух (и более) жестких дисков пользователь фактически получает объём лишь одного.
13

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 2:
RAID 2 (Parallel Array with ECC) – массивы, основанные на использовании кода Хэмминга.
Диски делятся на две группы:

Для данных .
Для кодов коррекции ошибок.
14
Причём если данные хранятся на дисках, то для хранения кодов коррекции необходимо n дисков. Суммарное количество дисков при этом будет равняться . Данные распределяются по дискам, предназначенным для хранения информации, так же, как и в RAID 0, то есть они разбиваются на небольшие блоки по числу дисков. Оставшиеся диски хранят коды коррекции ошибок, по которым в случае выхода какого-либо жёсткого диска из строя возможно восстановление информации.

Метод Хэмминга давно применяется в памяти типа ECC и позволяет на лету исправлять однократные и обнаруживать двукратные ошибки.

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 2:
Преимущества:
Повышение скорости дисковых операций по сравнению с производительностью одного диска.

Недостатки:
Минимальное количество дисков, при котором имеет смысл использовать RAID2 - 7, начиная с этого количества для него требуется меньше дисков, чем для RAID 1 (4 диска с данными, 3 диска с кодами коррекции ошибок), в дальнейшем избыточность уменьшается по экспоненте.
15

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 3:
RAID 3 (Parallel Array with Parity) из n дисков данные разбиваются на куски размером меньше сектора (разбиваются на байты или блоки) и распределяются по n-1 дискам. Ещё один диск используется для хранения блоков чётности.

В RAID 2 для этой цели применялся n-1 диск, но большая часть информации на контрольных дисках использовалась для коррекции ошибок «на лету», в то же время большинство пользователей устраивает простое восстановление информации в случае её повреждения, для чего хватает данных, умещающихся на одном выделенном жёстком диске.
16

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 3:
Преимущества:
Высокая скорость чтения и записи данных.
Минимальное количество дисков для создания массива равно трём.

Недостатки:
Массив этого типа хорош только для однозадачной работы с большими файлами, так как время доступа к отдельному сектору, разбитому по дискам, равно максимальному из интервалов доступа к секторам каждого из дисков. Для блоков малого размера время доступа намного больше времени чтения.
Большая нагрузка на контрольный диск, и, как следствие, его надёжность сильно падает по сравнению с дисками, хранящими данные.
17
RAID 3 отличается от RAID 2 невозможностью коррекции ошибок на лету.

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 4:
RAID 4 (Striped Array with Parity) похож на RAID 3, но отличает тем, что данные разбиваются на блоки, а не на байты. Таким образом отчасти решается проблема низкой скорости передачи данных небольшого объёма. Запись же производится медленно из-за того, что чётность для блока генерируется при записи и записывается на единственный диск.
18
Из широко распространённых систем хранения RAID-4 применяется на устройствах компании NetApp (NetApp FAS), где его недостатки успешно устранены за счет работы дисков в специальном режиме групповой записи, определяемом используемой на устройствах внутренней файловой системой WAFL.

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 5:
RAID 5 - Striping Array with Rotating Parity В этом классе дисковых подсистем также применяется техника расщепления, причем не только для основных данных, но и для информации о контрольных суммах, что позволяет выполнять несколько операций записи одновременно.
19
RAID 5 отличается от RAID 3 большим размером блока записываемых данных. Размещение избыточной информации повышает производительность дискового массива. Массивы RAID 5 ориентированы на напряженную работу с дисками и хорошо подходят для многопользовательских систем. При грамотном планировании операций записи можно параллельно обрабатывать до N/2 блоков, где N - число дисков в группе. Минимальное число дисков - три.

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 5:
20
Преимущества:
Экономичность - объём дискового массива RAID 5 рассчитывается по формуле (n-1)*hddsize, где n - число дисков в массиве, а hddsize - размер диска (наименьшего, если диски имеют разный размер).
Высокая скорость чтения - выигрыш достигается за счёт независимых потоков данных с нескольких дисков массива, которые могут обрабатываться параллельно.

Недостатки:
Производительность RAID 5 заметно ниже на операциях типа Random Write (записи в произвольном порядке), при которых производительность падает на 10-25% от производительности RAID 0 (или RAID 10), так как требует большего количества операций с дисками (каждая операция записи, за исключением так называемых full-stripe write-ов, заменяется на контроллере RAID на четыре - две операции чтения и две операции записи).

Описание слайда:

21
RAID-МАССИВЫ. УРОВЕНЬ 5:
2. При выходе из строя одного диска надёжность тома сразу снижается до уровня RAID 0 с соответствующим количеством дисков n-1 - то есть в n-1 раз ниже надёжности одного диска - данное состояние называется критическим (degrade или critical). Для возвращения массива к нормальной работе требуется длительный процесс восстановления, связанный с ощутимой потерей производительности и повышенным риском.
3. В ходе восстановления (rebuild или reconstruction) контроллер осуществляет длительное интенсивное чтение, которое может спровоцировать выход из строя ещё одного или нескольких дисков массива. Кроме того, в ходе чтения могут выявляться ранее не обнаруженные сбои чтения в массивах cold data (данных, к которым не обращаются при обычной работе массива, архивные и малоактивные данные), препятствующие восстановлению. Если до полного восстановления массива произойдет выход из строя, или возникнет невосстановимая ошибка чтения хотя бы на ещё одном диске, то массив разрушается и данные на нём восстановлению обычными методами не подлежат. Для предотвращения таких ситуаций в RAID-контроллерах может применяться анализ атрибутов S.M.A.R.T.

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 6:
RAID 6 (Independent Data Disks with Two Independent Distributed Parity Schemes) - похож на RAID 5, но имеет более высокую степень надёжности - три диска данных и два диска контроля чётности.
Основан на кодах Рида - Соломона и обеспечивает работоспособность после одновременного выхода из строя любых двух дисков.

22
Использование RAID-6 вызывает примерно 10-15% падение производительности дисковой группы, относительно RAID 5, что вызвано бо́льшим объёмом работы для контроллера (более сложный алгоритм расчёта контрольных сумм), а также необходимостью читать и перезаписывать больше дисковых блоков при записи каждого блока.

Описание слайда:

RAID-МАССИВЫ. УРОВЕНЬ 10 (1+0):
Помимо базовых уровней RAID 0 - RAID 6, описанных в стандарте «Common RAID Disk Drive Format (DEF) standard», существуют комбинированные уровни с названиями вида «RAID α+β» или «RAID αβ», что обычно означает «RAID β, составленный из нескольких RAID α» (иногда производители интерпретируют это по-своему).
23
Комбинированные уровни наследуют как преимущества, так и недостатки своих «родителей»
Например:
RAID 10 (или RAID 1+0) - это RAID 0, составленный из нескольких (или хотя бы двух) RAID 1 (зеркалированных пар).
RAID 51 - RAID 1, зеркалирующий два RAID 5 .

Описание слайда:

RAID (англ. redundant array of independent disks — избыточный массив независимых жёстких дисков) — массив из нескольких дисков, управляемых контроллером, взаимосвязанных скоростными каналами и воспринимаемых внешней системой как единое целое. В зависимости от типа используемого массива может обеспечивать различные степени отказоустойчивости и быстродействия. Служит для повышения надёжности хранения данных и/или для повышения скорости чтения/записи информации. Изначально, подобные массивы строились в качестве резерва носителям на оперативной (RAM) памяти, которая в то время была дорогой. Со временем, аббревиатура приобрела второе значение – массив уже был из независимых дисков, подразумевая использование нескольких дисков, а не разделов одного диска, а также дороговизну (теперь уже относительно просто нескольких дисков) оборудования, необходимого для построения этого самого массива.

Рассмотрим, какие бывают RAID массивы. Сперва рассмотрим уровни, которые были представлены учёными из Беркли, потом их комбинации и необычные режимы. Стоит заметить, что если используются диски разного размера (что не рекомендуется), то работать они буду по объёму наименьшего. Лишний объем больших дисков просто будет недоступен.

RAID 0. Дисковый массив с чередованием без отказоустойчивости/чётности (Stripe)

Однако чудес не бывает, а если бывают, то нечасто. Производительность растёт всё же не в N раз (N – число дисков), а меньше. В первую очередь, увеличивается в N раз время доступа к диску, и без того высокое относительно других подсистем компьютера. Качество контроллера оказывает не меньшее влияние. Если он не самый лучший, то скорость может едва заметно отличаться от скорости одного диска. Ну и немалое влияние оказывает интерфейс, которым RAID контроллер соединён с остальной системой. Всё это может привести не только к меньшему, чем N увеличению скорости линейного чтения, но и к пределу количества дисков, установка выше которого прироста давать уже не будет вовсе. Или, наоборот, будет слегка снижать скорость. В реальных задачах, с большим числом запросов шанс столкнуться с этим явлением минимален, ибо скорость весьма сильно упирается в сам жёсткий диск и его возможности.

Как видно, в этом режиме избыточности нет как таковой. Используется всё дисковое пространство. Однако, если один из дисков выходит из строя, то, очевидно, теряется вся информация.

RAID 1. Зеркалирование (Mirror)

Минусы – высокая избыточность, так как нужно вдвое больше дисков для создания такого массива. Ещё одним минусом является то, что отсутствует какой-либо прирост производительности – ведь на второй диск просто пишется копия данных первого.

RAID 2 Массив с использованием ошибкоустойчивого кода Хемминга.

Данный код позволяет исправлять и обнаруживать двойные ошибки. Активно используется в памяти с коррекцией ошибок (ECC). В этом режиме диски разбиваются на две группы – одна часть используется для хранения данных и работает аналогично RAID 0, разбивая блоки данных по разным дискам; вторая часть используется для хранения ECC кодов.

Главным минусом является высокая избыточность (при малом числе дисков она почти двойная, n-1). При увеличении числа дисков удельное число дисков хранения ECC кодов становится меньше (снижается удельная избыточность). Вторым минусом является низкая скорость работы с мелкими файлами. Из-за громоздкости и высокой избыточности с малым числом дисков, данный уровень RAID в данное время не используется, сдав позиции более высоким уровням.

RAID 3. Отказоустойчивый массив с битовым чередованием и чётностью.

Данный режим записывает данные по блокам на разные диски, как RAID 0, но использует ещё один диск для хранения четности. Таким образом, избыточность намного ниже, чем в RAID 2 и составляет всего один диск. В случае сбоя одного диска, скорость практически не меняется.

Из основных минусов надо отметить низкую скорость при работе с мелкими файлами и множеством запросов. Связано это с тем, что все контрольные коды хранятся на одном диске и при операциях ввода/вывода их необходимо переписывать. Скорость этого диска и ограничивает скорость работы всего массива. Биты чётности пишутся только при записи данных. А при чтении – они проверяются. По причине этого наблюдается дисбаланс в скорости чтения/записи. Одиночное чтение небольших файлов также характеризуется невысокой скоростью, что связано с невозможностью параллельного доступа с независимых дисков, когда разные диски параллельно выполняют запросы.

RAID 4

Данные записываются блоками на разные диски, один диск используется для хранения битов чётности. Отличие от RAID 3 заключается в том, что блоки разбиваются не по битам и байтам, а по секторам. Преимущества заключаются в высокой скорости передачи при работе с большими файлами. Также высока скорость работы с большим числом запросов на чтение. Из недостатков можно отметить доставшиеся от RAID 3 – дисбаланс в скорости операций чтения/записи и существование условий, затрудняющих параллельный доступ к данным.

RAID 5. Дисковый массив с чередованием и распределённой чётностью.

RAID 6. Дисковый массив с чередованием и двойной распределённой чётностью.

Всё отличие сводится к тому, что используются две схемы чётности. Система устойчива к отказам двух дисков. Основной сложностью является то, что для реализации этого приходится делать больше операций при выполнении записи. Из-за этого скорость записи является чрезвычайно низкой.

Комбинированные (nested) уровни RAID.

Поскольку массивы RAID являются прозрачными для ОС, то вскоре пришло время и созданию массивов, элементами которых являются не диски, а массивы других уровней. Обычно они пишутся через плюс. Первая цифра означает то, массивы какого уровня входят в качестве элементов, а вторая цифра – то, какую организацию имеет верхний уровень, который объединяет элементы.

RAID 0+1

Комбинация, которая является массивом RAID 1, собранным на базе массивов RAID 0. Как и в массиве RAID 1, доступным будет только половина объёма дисков. Но, как и в RAID 0, скорость будет выше, чем с одним диском. Для реализации такого решения необходимо минимум 4 диска.

RAID 1+0

Также известен, как RAID 10. Является страйпом зеркал, то есть, массивом RAID 0, построенным из RAID 1 массивов. Практически аналогичен предыдущему решению.

RAID 0+3

Массив с выделенной чётностью над чередованием. Является массивом 3-го уровня, в котором данные блоками разбиваются и пишутся на массивы RAID 0. Комбинации, кроме простейших 0+1 и 1+0 требуют специализированных контроллеров, зачастую достаточно дорогих. Надёжность данного вида ниже, чем у следующего варианта.

RAID 3+0

Также известен, как RAID 30. Является страйпом (массивом RAID 0) из массивов RAID 3. Обладает весьма высокой скорость передачи данных, вкупе с неплохой отказоустойчивостью. Данные сначала разделяются на блоки (как в RAID 0) и попадают на массивы-элементы. Там они опять делятся на блоки, считается их чётность, блоки пишутся на все диски кроме одного, на который пишутся биты чётности. В данном случае, из строя может выйти один из дисков каждого из входящих в состав RAID 3 массива.

RAID 5+0 (50)

Создаётся путём объединения массивов RAID 5 в массив RAID 0. Обладает высокой скоростью передачи данных и обработки запросов. Обладает средней скоростью восстановления данных и хорошей стойкостью при отказе. Комбинация RAID 0+5 также существует, но больше теоретически, так как даёт слишком мало преимуществ.

RAID 5+1 (51)

Сочетание зеркалирования и чередования с распределённой четностью. Также вариантом является RAID 15 (1+5). Обладает очень высокой отказоустойчивостью. Массив 1+5 способен работать при отказе трех дисков, а 5+1 – пяти из восьми дисков.

RAID 6+0 (60)

Чередование с двойной распределённой четностью. Иными словами – страйп из RAID 6. Как уже говорилось применительно к RAID 0+5, RAID 6 из страйпов не получил распространения (0+6). Подобные приёмы (страйп из массивов с четностью) позволяют повысить скорость работы массива. Ещё одним преимуществом является то, что так можно легко повысить объём, не усложняя ситуации с задержками, необходимыми на вычисление и запись большего числа битов четности.

RAID 100 (10+0)

Нестандартные режимы RAID

Двойная четность

RAID-DP

Является разработкой NetApp RAID массива с двойной четностью и подпадает под обновленное определение RAID 6. Использует отличную от классической RAID 6 реализации схему записи данных. Запись ведется сначала на кеш NVRAM, снабжённый источником бесперебойного питания, чтобы предотвратить потерю данных при отключении электричества. Программное обеспечение контроллера, по возможности, пишет только цельные блоки на диски. Такая схема предоставляет большую защиту, чем RAID 1 и имеет более высокую скорость работы, нежели обычный RAID 6.

RAID 1,5

Был предложен компанией Highpoint, однако теперь применяется очень часто в контроллерах RAID 1, без каких-либо выделений данной особенности. Суть сводится к простой оптимизации – данные пишутся как на обычный массив RAID 1 (чем 1,5 по сути и является), а читают данные с чередованием с двух дисков (как в RAID 0). В конкретной реализации от Highpoint, применявшейся на платах DFI серии LanParty на чипсете nForce 2, прирост был едва заметным, а порой и нулевым. Связано это, вероятно, с невысокой скоростью контроллеров данного производителя в целом в то время.

RAID 1E

Комбинирует в себе RAID 0 и RAID 1. Создаётся минимум на трёх дисках. Данные пишутся с чередованием на три диска, а со сдвигом на 1 диск пишется их копия. Если пишется один блок на три диска, то копия первой части пишется на второй диск, второй части – на третий диск. При использовании четного числа дисков лучше, конечно, использовать RAID 10.

RAID 5E

Обычно при построении RAID 5 один диск оставляют свободным (spare), чтобы в случае сбоя система сразу стала перестраивать (rebuild) массив. При обычной работе этот диск работает вхолостую. Система RAID 5E подразумевает использование этого диска в качестве элемента массива. А объём этого свободного диска распределяется по всему массиву и находится в конце дисков. Минимальное число дисков – 4 штуки. Доступный объём равен n-2, объём одного диска используется (будучи распределенным между всеми) для четности, объем еще одного – свободный. При выходе из строя диска происходит сжатие массива до 3-х дисков (на примере минимального числа) заполнением свободного пространства. Получается обычный массив RAID 5, устойчивый к отказу ещё одного диска. При подключении нового диска, массив расжимается и занимает вновь все диски. Стоит отметить, что во время сжатия и распаковки диск не является устойчивым к выходу еще одного диска. Также он недоступен для чтения/записи в это время. Основное преимущество – большая скорость работы, поскольку чередование происходит на большем числе дисков. Минус – что нельзя данный диск назначать сразу к нескольким массивам, что возможно в простом массиве RAID 5.

RAID 5EE

Отличается от предыдущего только тем, что области свободного места на дисках не зарезервированы одним куском в конце диска, а чередуются блоками с битами четности. Такая технология значительно ускоряет восстановление после сбоя системы. Блоки можно записать прямо на свободное место, без необходимости перемещения по диску.

RAID 6E

Аналогично с RAID 5E использует дополнительный диск для повышения скорости работы и распределения нагрузки. Свободное место разделяется между другими дисками и находится в конце дисков.

RAID 7

Intel Matrix RAID

Является технологией, представленной Intel в южных мостах, начиная с ICH6R. Суть сводится к возможности комбинации RAID массивов разных уровней на разделах дисков, а не на отдельных дисках. Скажем, на двух дисках можно организовать по два раздела, два из них будут хранить на себе операционную систему на массиве RAID 0, а другие два – работая в режиме RAID 1 – хранить копии документов.

Linux MD RAID 10

Это RAID драйвер ядра Linux, предоставляющий возможность создания более продвинутой версии RAID 10. Так, если для RAID 10 существовало ограничение в виде чётного числа дисков, то этот драйвер может работать и с нечетным. Принцип для трех дисков будет тем же, что в RAID 1E, когда происходит чередование дисков по очереди для создания копии и чередования блоков, как в RAID 0. Для четырех дисков это будет эквивалентно обычному RAID 10. Помимо этого, можно задавать, на какой области диска будет храниться копия. Скажем, оригинал будет в первой половине первого диска, а его копия – во второй половине второго. Со второй половиной данных – наоборот. Данные можно дублировать несколько раз. Хранение копий на разных частях диска позволяет достичь большей скорости доступа в результате разнородности жесткого диска (скорость доступа меняется в зависимости от расположения данных на пластине, обычно разница составляет два раза).

RAID-K

Разработан компанией Kaleidescape для использования в своих медиа устройствах. Схож с RAID 4 с использованием двойной четности, но использует другой метод отказоустойчивости. Пользователь может легко расширять массив, просто добавляя диски, причём в случае, если он содержит данные, данные будут просто добавлены в него, вместо удаления, как это требуется обычно.

RAID-Z

JBOD

Drive Extender

Функция, заложенная в Window Home Server. Совмещает в себе JBOD и RAID 1. При необходимости создания копии, она не дублирует сразу файл, а ставит NTFS разделе метку, указывающую на данные. При простое система копирует файл так, чтобы место на дисках было максимальным (использовать можно диски разного объема). Позволяет достичь многих преимуществ RAID – отказоустойчивости и возможности простой замены вышедшего из строя диска и его восстановления в фоновом режиме, прозрачности местонахождения файла (вне зависимости от того, на каком диске он находится). Также можно проводить параллельный доступ с разных дисков с помощью вышеуказанных меток, получая сходную с RAID 0 производительность.

UNRAID

Разработана компанией Lime technology LLC. Эта схема отличается от обычных RAID массивов тем, что позволяет смешивать диски SATA и PATA в одном массиве и диски разных объема и скорости. Для контрольной суммы (четности) используется выделенный диск. Данные не чередуются между дисками. В случае отказа одного диска, теряются только файлы, на нём хранящиеся. Однако, с помощью четности они могут быть восстановлены. UNRAID внедрен как добавление к Linux MD (multidisk).

Большинство видов RAID массивов не получило распространения, часть используется в узких сферах применения. Наиболее массовыми, от простых пользователей до серверов начального уровня стали RAID 0, 1, 0+1/10, 5 и 6. Нужен ли вам рейд-массив для ваших задач – решать вам. Теперь вы знаете, в чём их отличия друг от друга.

RAID (англ. Redundant Array of Independent Disks — избыточный массив независимых (самостоятельных) дисков) — технология виртуализации данных для объединения нескольких физических дисковых устройств в логический модуль для повышения отказоустойчивости и производительности.

Аббревиатура «RAID» изначально расшифровывалась как «Redundant Array of Inexpensive Disks» («избыточный массив недорогих дисков», так как они были гораздо дешевле дисков SLED (Single Large Expensive Drive)).

Именно так был представлен RAID его создателями Петтерсоном (David A. Patterson), Гибсоном (Garth A. Gibson) и Катцом (Randy H. Katz) в 1987 году .

Со временем «RAID» стали расшифровывать как «Redundant Array of Independent Disks» («избыточный массив независимых (самостоятельных) дисков»), потому что для массивов приходилось использовать и дорогое оборудование.

Уровни спецификации RAID

Для решения указанных задач была предложена технология RAID-6, ориентированная на восстановление двух дисков.

Для расчета числа дисков и избыточности можно использовать

Собираем RAID 1 (зеркало) дома

Для домашнего использования вполне хватит обычного зеркала RAID 1 .

Вот, например, ASUS P5Q3 (socket 775, 4 слота DDR3, до 16 Гб):

Заходим в BIOS и выбираем конфигурацию дисков

С контроллером Intel это работает нормально, с контроллером Marvell (два отдельных SATA порта) могут быть проблемы. Читаем форумы.

Задача для RAID 1 посложнее:

Как создать из дисков 1 и 2 массив RAID 1 и не потерять данные с первого диска? Windows 7 (и 8 и 10) тоже умеют делать программный RAID 1.

Администрирование -> Управление компьютером -> Управление дисками

Если мы хотим невозможного:

загрузочный диск не трогаем
из двух дисков HDD нужно сделать RAID 1
использовать аппаратный контроллер

Ищем аппаратный контроллер для PCI-e с разъемами SATA (поддержкой RAID) и подключаем два HDD туда, а не к разъемам на материнской плате.

Вот, например, ORIENT A1061RAID:

PCI-Express 2.0 x1
2 внутренних порта SATA 6Gb/s (7-pin)
AHCI (2 диска раздельно)
RAID 0 (объединение дисков)
RAID 1 (зеркальный режим)
Объем каждого диска до 6 Тб

Скорее всего второй диск тоже на исчерпании ресурса и при восстановлении массива он выйдет из строя:

Вы можете сохранить ссылку на эту страницу себе на компьютер в виде htm файла

Вы будете видеть наш сайт у себя в ленте

Почитать в разделе: Диски

Всего статей в разделе: 10
Показано статей в списке: 9
Сортировка: название по алфавиту

RAM диск

Интерфейс NVMe и разъемы M.2 и U.2

NVM Express — спецификация на протоколы доступа к твердотельным накопителям (SSD), подключённым по шине PCI Express. «NVM» в названии спецификации обозначает энергонезависимую память, в качестве которой в SSD повсеместно используется флеш-память типа NAND. Интерфейс NVMe - это именно интерфейс. В виде разъемов он может существовать как: PCI-e как диск SSD PCI-e как переходник для разъемов M.2 (как на фото выше) собственно разъем M.2 на материнской плате разъем U.2 на материнской плате NVMe (Non-Volatile Memory Host Controller Interface Specification) — логический интерфейс, намного более быстрый чем SATA (фактически замена SATA) и специально.
(Читать полностью. )

Интерфейсы PATA, IDE и SCSI

PATA - Parallel Advanced Technology Attachment — параллельный интерфейс подключения накопителей, фактически другое название для IDE ATA - Advanced Technology Attachment — интерфейс подключения накопителей ATAPI - Advanced Technology Attachment Packet Interface - вариант интерфейса для подключения сменных устройств (CD/DVD ROM) IDE - Integrated Device Electronics - дословно интегрированная электроника устройства - т.е. контроллер встроен в сам привод (см. ниже DMA) DMA - Direct memory access — прямой доступ к памяти SCSI - Small Computer System Interface - вариант PATA для серверов. Теперь подробнее. Важным этапом в развитии ATA стал переход.
(Читать полностью. )

Интерфейсы SAS и SATA

Программы для работы с разделами диска

Непростой выбор программы для работы с разделами диска И в чем тут проблема? Полно программ, есть бесплатные версии - выбирай. Ага - как показал опыт, не все программы делают то, что просит от них пользователь. Однако. Что мы хотим от программы управление разделами? Скопировать раздел - бери и копируй? Мы же хотим получить именно копию. Что может быть при копировании: возможно копирование как данных (порядок данных на секторах не сохраняется), так и по секторам (важно для переноса операционной системы) сохранение системного номера раздела (серийный номер для Windows и UUID для Linux) - фактически номер присваивается в момент форматирования раздела (да - фиксируется.
(Читать полностью. )

Разметка диска MBR или GPT

Сначала про разделы на диске MBR и GPT - это не разделы. Это способ образования разделов на диске, тип MBR/GPT относится в целом к диску. Вот хорошая статья на Хабре Изучаем структуры MBR и GPT MBR (MASTER BOOT RECORD) главная загрузочная запись содержит таблицу разделов, которая описывает, как разделы расположены на диске. С этим типом разделения первый сектор на жестком диске содержит главную загрузочную область и файл двоичного кода, названный кодом начальной загрузки загрузчика. С типом разделов MBR диски поддерживают тома до 2 терабайт и используют один из двух типов разделения: Первичный (Primary) Расширенный.
(Читать полностью. )

Системный номер раздела диска UUID / GUID / serial number

Функция TRIM

TRIM (англ. to trim — подрезать) — команда интерфейса ATA, позволяющая операционной системе уведомить твердотельный накопитель о том, какие блоки данных уже не содержатся в файловой системе и могут быть использованы накопителем для физического удаления. Команда TRIM была введена вскоре после появления твердотельных накопителей (SSD), чтобы сделать их конкурентоспособной альтернативой традиционным HDD в персональных компьютерах. Из-за того, что на внутреннем уровне реализация операций в SSD существенно отличается от реализации тех же операций в традиционных механических жёстких дисках, обычные методы ОС таких операций, как удаление файлов и форматирование диска (не обращаясь.
(Читать полностью. )

В системах хранения данных критически важны сохранность и время восстановления в случае сбоя. Свою ценность, а в некоторых задачах и более высокую, имеет скорость работы накопителей. Использование RAID-массивов в различных конфигурациях — это поиск компромисса между перечисленными параметрами.

RAID — это технология объединения двух и более накопителей в единый логический элемент с целью повышения производительности и (или) отказоустойчивости отдельно взятого элемента массива.

RAID-массивы классифицируются по следующим параметрам:

по исполнению RAID контроллера;
по типам поддерживаемых интерфейсов накопителей;
по поддерживаемым уровням RAID.

RAID-контроллеры: аппаратные и не очень

По исполнению контроллеры делятся на программные и аппаратные. Программные реализуются непосредственно средствами операционной системы или на уровне материнской платы. Последние также известны как интегрированные, а также Fake-RAID. Они работают быстрее чисто софтверных решений за счет специального чипа для управления массивом. Недавно публиковался текст о развертывании таких технологий. Дополнительной железки при этом никакой нет и в любом случае будут использоваться ресурсы вычислительной машины.

Аппаратные RAID-контроллеры выполняются в форм-факторе платы PCIe либо в составе внешнего автономного устройства — дискового массива.

Они имеют на борту собственные процессор, память, BIOS и специальный интерфейс для конфигурации. Платы PCIe также комплектуются дополнительными модулями, сохраняющими данные, если произойдет сбой в электропитании: BBU с Li-Ion аккумулятором и ZMCP на базе суперконденсатора.

Оба модуля позволяют сделать сэйв содержимого кэша. После восстановления работы эти данные будут немедленно записаны на диск. Дисковый массив, будучи автономным, располагает собственными блоком питания и системой охлаждения.

Накопители подключаются к плате либо кабелями напрямую, либо через платы расширения. Автономные дисковые массивы содержат все накопители внутри себя, а наружу смотрит все тот же интерфейс PCIe (есть и другие варианты, например, USB 3.2 и Thunderbolt 3). Кстати, известный вид дисковых массивов — сетевое хранилище данных (NAS).

Что можно подключать к RAID-контроллеру

Следующий важный параметр, по которому различаются RAID-массивы, это поддержка интерфейсов накопителей. Не будем тревожить склеп с IDE-дисками, а констатируем, что по большому счету применяются три типа: SATA, SAS и NVMe. SAS — удел серверов, а вот остальные применяются повсеместно.

Есть программные и аппаратные RAID-контроллеры, которые умеют управлять массивом дисков с одним из интерфейсов. В формате PCIe есть и такие платы, которые реализуют режим Tri-Mode, позволяющий работать со смешанным составом накопителей.

Уровни RAID

Разобравшись с основными конструктивными особенностями RAID-контроллеров, перейдем к главной характеристике — поддержке уровней RAID. В подавляющим большинстве контроллеры работают с уровнями 0, 1, 1E, 10, 5, 5EE, 50, 6, 60. Другие занесены в красную книгу и на практике встречаются редко. Простейшие программные контроллеры позволяют создать RAID 0 и 1. Более продвинутые добавляют RAID 10 и 5. В аппаратных, как правило, такой перечень минимален, и многие платы поддерживают весь спектр уровней. Рассмотрим подробнее каждый из них.

Несколько важных нюансов для понимания эффективных объема и быстродействия, получаемых в результате объединения в массив:

при использовании накопителей разного объема контроллер «обрезает» объем каждого из них до наименьшего из используемых. Если у вас есть много дисков 4 ТБ и один 2 ТБ, то в массиве все диски будут восприниматься как 2 ТБ;
при использовании накопителей с разными скоростями ввода/вывода и задержками, то операции доступа будут осуществляться с наихудшими из всех параметров. Другими словами, самым быстрым дискам придется ждать, пока отработает самый медленный.

RAID 0

Единственный массив, который не совсем оправдывает название, поскольку не обладает избыточностью. При этом скорость и эффективный объем максимальны. Данные разбиваются на одинаковые блоки, равномерно записываемые на все диски по очереди. Эти блоки называются страйпами, отсюда и сам RAID 0 часто именуют страйпом. Считывание данных также происходит параллельно. Здесь конечно же есть свое но.

Дело в том, что прирост производительности не прямо пропорционален количеству дисков (как хотелось бы). В силу специфики накопителей, особенно механических, выигрыш в конфигурации RAID 0 хорошо заметен только на операциях последовательного чтения. Другими словами, при работе с большими файлами. Типичная область применения — игры, видеомонтаж и рендеринг. При условии, что регулярно производится резервирование на сторонние накопители. Наряду с этим при случайном доступе к файлам разница с отдельно взятым диском уже не так ощутима. Более позитивная картина наблюдается в случае твердотельных накопителей, но они и так удовлетворяют большинству запросов по быстродействию.

В общем, в современных реалиях RAID 0 далеко не всегда оправдает свое применение, а основная задача RAID-массива все же в повышении надежности хранения данных.

Обратная сторона медали за скорость как раз в отсутствии избыточности, что означает нулевую отказоустойчивость. В случае сбоя хотя бы одного из элементов массива, восстановление всего содержимого практически невозможно.

RAID 1

RAID 1, известный как «зеркало», представляет собой другую крайность. Он максимально избыточен — в нем производится 100 % дублирование данных. Этот процесс «съедает» ровно половину объема массива. Число дисков в нем, соответственно, четное. Позволяет увеличить скорость чтения, но синхронная скорость записи в некоторых случаях падает. При отказе одного из дисков работа автоматически продолжается с дублером. Если доступна функция горячей замены дисков, то восстановление штатного режима происходит без остановки. RAID 1 идеален для чувствительных данных.

RAID 5

Состоит минимум из трех накопителей, при этом доступный объем уменьшается на один. Данные записываются в страйпы на все диски кроме одного, на котором размещается контрольная сумма этой части данных. Запись этого блока также чередуется между всеми накопителями, распределяя равномерную нагрузку. Если их больше четырех, то скорость чтения будет выше чем в RAID 1, но запись будет осуществляться медленнее. Контрольные суммы позволяют достать информацию в случае выхода из строя одного из элементов. Сама операция восстановления вызывает повышенную нагрузку на оставшиеся диски. Значительно падает производительность и риск утери всех данных в случае отказа еще одного диска. Желательно иметь опцию горячей замены для оперативного возвращения в нормальный режим работы.

Со всеми плюсами и минусами эти три уровня наиболее распространены и просты в развертывании.

RAID 6

Развитие RAID 5 по части надежности, позволяющее пережить потерю двух дисков. В данной конфигурации в каждом проходе пишется две независимые контрольные суммы на два накопителя. Требуется минимум четыре диска, из которых два уйдет на описанный алгоритм повышения отказоустойчивости. При этом скорость записи будет еще ниже, чем у RAID 5.

Следующие уровни — производные и комбинации перечисленных.

RAID 10

Неплохо было бы объединить достоинства RAID 0 (производительность) и RAID 1 (отказоустойчивость)? Встречайте RAID 10: страйп и зеркало, два в одном. Но и недостатки не забудьте — по-прежнему половина объема уходит на резерв. А что делать, за надежность приходится платить. В этом плане менее экономичен, чем RAID 5 И RAID 6, но более прост в восстановлении после сбоя.

RAID 50

По похожей схеме получаем RAID 50. Здесь уже страйпы не зеркалируются, а распределяются по двум и более массивам RAID 5. Требуется от шести дисков, скорость чтения значительно увеличивается. Кроме того, нивелируется и слабое место RAID 5 и RAID 6 — низкая скорость записи. Отрицательная сторона опять лежит в плоскости экономики. Из эффективного объема выпадают два диска, как и RAID 6, при этом массив выдержит потерю только одного.

RAID 60

Данный гибрид RAID 0 и RAID 6 призван решить проблему производительности последнего. Отказоустойчивость остается на том же уровне, как и часть объема накопителей, отводимая на реализацию алгоритмов контроля целостности данных. Дисков для такого удовольствия понадобится как минимум восемь.

RAID 1E

Еще одна вариация совмещения алгоритмов зеркалирования и чередования данных. Записанные на одной итерации страйпы повторно записываются на следующей, но в обратном порядке. Таким образом в RAID 1E можно использовать три диска. Массив останется тем же зеркалом с эффективным объемом, равным половине от исходного.

RAID 5EE

Один из вариантов использования RAID 5 с резервным диском. Отличается тем, что этот диск не простаивает до выхода из строя одного из элементов массива, а используется наряду с другими. На каждой итерации помимо страйпов данными и контрольной суммой записывается резервный блок. Сделано это для ускорения процесса сборки массива в случае нештатной ситуации. Платой за такую опцию становится второй диск, исключаемый из эффективного объема RAID 5EE.

В таблице ниже приведены сравнительные характеристики рассмотренных уровней RAID.

Не забудем и про массив с незатейливым названием JBOD (дословно переводится как «просто связка дисков»). Строго говоря, он не является RAID-массивом. Это объединенные в один несколько дисков без дополнительной функциональности. Позволяет развернуть логический диск с объемом, который недоступен в рамках одного накопителя. Такой диск полезен для перемещения файлов больших размеров в несколько терабайт.

Вместо заключения напомним самое главное правило для всех, кто хранит данные в RAID-массиве: RAID-массив ≠ бэкап! Регулярно делайте резервные копии данных на независимые носители и да пребудет с вами сила.

Читайте также: