Сравнение raid 6 и raid 10

Обновлено: 06.07.2024

«Какой уровень RAID самый надежный?» Все знают, что наиболее распространенным является уровень RAID5, однако он отнюдь не лишен серьезных недостатков, которые неочевидны для неспециалистов.

RAID 0, RAID 1, RAID 5, RAID 10 или что такое уровни RAID?

В своей статье я попытаюсь охарактеризовать самые популярные уровни RAID, а затем сформулирую рекомендации по использованию этих уровней. Для иллюстрации статьи я построил диаграмму, на которой поместил эти уровни в трехмерном пространстве надежности, производительности и ценовой эффективности.

JBOD (Just a Bunch of Disks) – это простое объединение (spanning) жестких дисков, которое уровнем RAID формально не является. Томом JBOD может быть массив из одного диска или объединение нескольких дисков. Контроллеру RAID для работы с таким томом не требуется проведение каких-либо вычислений. На нашей диаграмме диск JBOD служит в качестве «ординара» или отправной точки – его значения надежности, производительности и стоимости совпадают с соответствующими показателями единичного жесткого диска.

RAID 0 (“Striping”) избыточности не имеет, а информацию распределяет сразу по всем входящим в массив дискам в виде небольших блоков («страйпов»). За счет этого существенно повышается производительность, но страдает надежность. Как и в случае JBOD, за свои деньги мы получаем 100% емкости диска.

Поясню, почему уменьшается надежность хранения данных на любом составном томе – так как при выходе из строя любого из входящих в него винчестеров полностью и безвозвратно пропадает вся информация. В соответствии с теорией вероятностей математически надежность тома RAID0 равна произведению надежностей составляющих его дисков, каждая из которых меньше единицы, поэтому совокупная надежность заведомо ниже надежности любого диска.

Хороший уровень – RAID 1 (“Mirroring”, «зеркало»). Он имеет защиту от выхода из строя половины имеющихся аппаратных средств (в общем случае – одного из двух жестких дисков), обеспечивает приемлемую скорость записи и выигрыш по скорости чтения за счет распараллеливания запросов. Недостаток заключается в том, что приходится выплачивать стоимость двух жестких дисков, получая полезный объем одного жесткого диска.

Изначально предполагается, что жесткий диск – вещь надежная. Соответственно, вероятность выхода из строя сразу двух дисков равна (по формуле) произведению вероятностей, т.е. ниже на порядки! К сожалению, реальная жизнь – не теория! Два винчестера берутся из одной партии и работают в одинаковых условиях, а при выходе из строя одного из дисков нагрузка на оставшийся увеличивается, поэтому на практике при выходе из строя одного из дисков следует срочно принимать меры – вновь восстанавливать избыточность. Для этого с любым уровнем RAID (кроме нулевого) рекомендуют использовать диски горячего резерва HotSpare. Достоинство такого подхода – поддержание постоянной надежности. Недостаток – еще большие издержки (т.е. стоимость 3-х винчестеров для хранения объема одного диска).

Зеркало на многих дисках – это уровень RAID 10. При использовании такого уровня зеркальные пары дисков выстраиваются в «цепочку», поэтому объем полученного тома может превосходить емкость одного жесткого диска. Достоинства и недостатки – такие же, как и у уровня RAID1. Как и в других случаях, рекомендуется включать в массив диски горячего резерва HotSpare из расчета один резервный на пять рабочих.

RAID 5, действительно, самый популярный из уровней – в первую очередь благодаря своей экономичности. Жертвуя ради избыточности емкостью всего одного диска из массива, мы получаем защиту от выхода из строя любого из винчестеров тома. На запись информации на том RAID5 тратятся дополнительные ресурсы, так как требуются дополнительные вычисления, зато при чтении (по сравнению с отдельным винчестером) имеется выигрыш, потому что потоки данных с нескольких накопителей массива распараллеливаются.

Недостатки RAID5 проявляются при выходе из строя одного из дисков – весь том переходит в критический режим, все операции записи и чтения сопровождаются дополнительными манипуляциями, резко падает производительность, диски начинают греться. Если срочно не принять меры – можно потерять весь том. Поэтому, (см. выше) с томом RAID5 следует обязательно использовать диск Hot Spare.

Помимо базовых уровней RAID0 - RAID5, описанных в стандарте, существуют комбинированные уровни RAID10, RAID30, RAID50, RAID15, которые различные производители интерпретируют каждый по-своему.

Суть таких комбинаций вкратце заключается в следующем. RAID10 – это сочетание единички и нолика (см. выше). RAID50 – это объединение по “0” томов 5-го уровня. RAID15 – «зеркало» «пятерок». И так далее.

Таким образом, комбинированные уровни наследуют преимущества (и недостатки) своих «родителей». Так, появление «нолика» в уровне RAID 50 нисколько не добавляет ему надежности, но зато положительно отражается на производительности. Уровень RAID 15, наверное, очень надежный, но он не самый быстрый и, к тому же, крайне неэкономичный (полезная емкость тома составляет меньше половины объема исходного дискового массива).

RAID 6 отличется от RAID 5 тем, что в каждом ряду данных (по английски stripe) имеет не один, а два блока контрольных сумм. Контрольные суммы - "многомерные", т.е. независимые друг от друга, поэтому даже отказ двух дисков в массиве позволяет сохранить исходные данные. Вычисление контрольных сумм по методу Рида-Соломона требует более интенсивных по сравнению с RAID5 вычислений, поэтому раньше шестой уровень практически не использовался. Сейчас он поддерживается многими продуктами, так как в них стали устанавливать специализированные микросхемы, выполняющие все необходимые математические операции.

Согласно некоторым исследованиям, восстановление целостности после отказа одного диска на томе RAID5, составленном из дисков SATA большого объема (400 и 500 гигабайт), в 5% случаев заканчивается утратой данных. Другими словами, в одном случае из двадцати во время регенерации массива RAID5 на диск резерва Hot Spare возможен выход из строя второго диска. Отсюда рекомендации лучших RAIDоводов: 1) всегда делайте резервные копии; 2) используйте RAID6!

Недавно появились новые уровни RAID1E, RAID5E, RAID5EE. Буква "Е" в названии означает Enhanced.

RAID level-1 Enhanced (RAID level-1E) комбинирует mirroring и data striping. Эта смесь уровней 0 и 1 устроена следующим образом. Данные в ряду распределяются точь-в-точь так, как в RAID 0. То есть ряд данных не имеет никакой избыточности. Следующий ряд блоков данных копирует предыдущий со сдвигом на один блок. Таким образом как и в стандартном режиме RAID 1 каждый блок данных имеет зеркальную копию на одном из дисков, поэтому полезный объем массива равен половине суммарного объема входящих в массив жестких дисков. Для работы RAID 1E требуется объединение трех или более дисков.

Мне очень нравится уровень RAID1E. Для мощной графической рабочей станции или даже для домашнего компьютера - оптимальный выбор! Он обладает всеми достоинствами нулевого и первого уровней - отличная скорость и высокая надежность.

Перейдем теперь к уровню RAID level-5 Enhanced (RAID level-5E). Это то же самое что и RAID5, только со встроенным в массив резервным диском spare drive. Это встраивание производится следующим образом: на всех дисках массива оставляется свободным 1/N часть пространства, которая при отказе одного из дисков используется в качестве горячего резерва. За счет этого RAID5E демонстрирует наряду с надежностью лучшую производительность, так как чтение/запись производится параллельно с бОльшего числа накопителей одновременно и spare drive не простаивает, как в RAID5. Очевидно, что входящий в том резервный диск нельзя делить с другими томами (dedicated vs. shared). Том RAID 5E строится минимум на четырех физических дисках. Полезный объем логического тома вычисляется по формуле N-2.

Как ни странно, никаких упоминаний об уровне RAID 6E на просторах Интернета я не нашел - пока такой уровень никем из производителей не предлагается и даже не анонсируется. А ведь уровень RAID6E ( или RAID6EE? ) можно предложить по тому же принципу, что и предыдущий. Диск HotSpare обязательно должен сопровождать любой том RAID, в том числе и RAID 6. Конечно, мы не потеряем информацию при выходе из строя одного или двух дисков, но начать регенерацию целостности массива крайне важно как можно раньше, чтобы скорее вывести систему из "критического" режима. Поскольку необходимость диска Hot Spare для нас не подлежит сомнению, логичным было бы последовать дальше и "размазать" его по тому так, как это сделано в RAID 5EE, чтобы получить преимущества от использования бОльшего количества дисков (лучшая скорость на чтении-записи и более быстрое восстановление целостности).

Уровни RAID в "числах".

В таблицу я собрал некоторые важные параметры почти всех уровней RАID, чтобы можно было сопоставить их между собой и четче понять их суть.

Произво дительность записи

Все "зеркальные" уровни — RAID 1, 1+0, 10, 1E, 1E0.

Давайте еще раз попробуем досконально разобраться, чем же различаются эти уровни?

RAID 1.
Это - классическое "зеркало". Два (и только два!) жестких диска работают как один, являясь полной копией друг друга. Выход из строя любого из этих двух дисков не приводит к потере ваших данных, так как контроллер продолжает работу с оставшимся диском. RAID1 в цифрах: двукратная избыточность, двукратная надежность, двукратная стоимость. Производительность на запись эквивалентна производительности одного жесткого диска. Производительность чтения выше, так как контроллер может распределять операции чтения между двумя дисками.

RAID 10.
Суть этого уровня в том, что диски массива объединяются парами в "зеркала" (RAID 1), а затем все эти зеркальные пары в свою очередь объединяются в общий массив с чередованием (RAID 0). Именно поэтому его иногда обозначают как RAID 1+0. Важный момент - в RAID 10 можно объединить только четное количество дисков (минимум - 4, максимум - 16). Достоинства: от "зеркала" наследуется надежность, от "нуля" - производительность как на чтение, так и на запись.

RAID 1Е.
Буква "E" в названии означает "Enhanced", т.е. "улучшенный". Принцип этого улучшения следующий: данные блоками "чередуются" ("striped") на все диски массива, а потом еще раз "чередуются" со сдвигом на один диск. В RAID 1E можно объединять от трех до 16 дисков. Надежность соответствует показателям "десятки", а производительность за счет большего "чередования" становится чуть лучше.

RAID 1Е0.
Этот уровень реализуется так: мы создаем "нулевой" массив из массивов RAID1E. Следовательно, общее количество дисков должно быть кратно трем: минимум три и максимум - шестьдесят! Преимущество в скорости при этом мы вряд ли получим, а сложность реализации может неблагоприятно отразиться на надежности. Главное достоинство - возможность объединить в один массив очень большое (до 60) количество дисков.

Сходство всех уровней RAID 1X заключается в их показателях избыточности: ради реализации надежности жертвуется ровно 50% суммарной емкости дисков массива.

среда, 9 июня 2010 г.

RAID 6 или RAID 10 (RAID 1+0): Что выбрать?

RAID 6 и RAID 10: преимущества и недостатки

Хотя цена всегда являлась важным фактором при покупке нового хранилища данных, современный этап развития технологий позволяет сосредоточиться на качественной, а не на количественной стороне хранения информации. Исходя из этих соображений, самое лучшее RAID - решение, это, конечно RAID 10 (чередование зеркалированных дисков).

Оценивая различные массивы, не будем учитывать емкость (предположим, что у нас много места), а сосредоточимся на сбалансированности процесса записи\чтения. В таком случае, RAID 10 выигрывает у двух выше рассмотренных типов массивов, так как требует только 2 этапа записи, в отличие от RAID 5, где 4 точки записи информации, и уж тем более RAID 6, который накладывает ограничение в 6х.
Кроме того, RAID 10 обладает рядом других преимуществ:

- Выше скорость записи. RAID 1+0 устанавливает только 2х задержку.

- Быстрое восстановление скорости. Смена или восстановление диска гораздо проще и быстрее чем в RAID 6. При реализации горячего резервирования процесс идет весьма быстро, поэтому вряд ли вы будете страдать от безвозвратной одновременной потери двух дисков.

- Может выдержать потерю нескольких дисков (в некоторых случаях). Это немного шаткое положение, но его важно отметить. Конечно, RAID 6 может выдержать потерю двух дисков в массиве, и это имеет наибольшее значение для тех, кто выбирает именно такую организацию хранения данных. Однако вероятность одновременного выхода из строя двух зеркалированных дисков в RAID 1+0 крайне низка. Поэтому если информация правильно распределена, вы теоретически можете выдержать потерю каждого диска с одной стороны зеркала (то есть половину всех ваших носителей), продолжая работать с другой копией данных через ваш RAID контроллер .

- Снижение производительности во время процесса восстановления является минимальным. Когда выходит из строя один из дисков в RAID 6, процесс восстановления серьезно снижает общую эффективность хранения данных в связи с необходимостью пересчета контрольных сумм. Восстановление данных на RAID 10 является относительно скрытым процессом.

Мой выбор был бы RAID 6 для файлового сервера, так как вы можете потерять два диска, и не имеет значения, какой набор из двух может умереть. Насколько я понимаю, с RAID 10 вы можете потерять два диска, но если они окажутся в одном массиве RAID 1, то вам не повезло? Какие-либо предложения? Базовый файловый сервер с около 200 ГБ данных, и он будет действовать в качестве единой точки резервного копирования для других рабочих станций и серверов.

«Единая точка резервного копирования» означает хранилище резервных копий по всей сети. это ваша единственная точка, которую вы затем копируете на носитель. я бы никогда не сделал резервную копию одного сервера, потом другого, потом другого. это работало бы, если бы у вас был только один, у нас есть около 10. Если ваша настоящая цель состоит в том, чтобы иметь «безопасное» место для хранения резервных копий, то я бы просто купил кучу дисков, а затем менял диски ежедневно и помещал неиспользуемые в пожаробезопасный или, что еще лучше, в удаленное место в безопасном месте. , RAID поможет повысить производительность и время безотказной работы даже в случае отказа одного диска, но не в случае, если сервер тает или здание сгорает. В прошлом это делалось с помощью ленточных накопителей, но в наши дни дополнительные диски, вероятно, являются гораздо более экономичным способом и более простым в управлении. dasko, любой из пунктов ниже отвечает на ваш вопрос?

Это зависит от того, что вы пытаетесь сделать. В то время как Raid 10 даст вам более быстрое чтение и запись двух, как вы сказали, можно потерять все, если вы потеряете не те два диска. Но на больших дисковых массивах вы можете потерять ровно половину дисков и сохранить полную работу. Но с Raid 6 ваши записи могут быть немного медленнее, чем дополнительная контрольная сумма. Но вы можете потерять любые два диска и не потерять данные.

Я думаю, что еще один важный момент, который нужно помнить, это то, что Raid - это не резервное копирование данных . Поэтому главное, на что нужно обратить внимание в RAID - это время работы сервера. Не сохраняя данные в целости.

Я думаю, в конце концов, это вопрос предпочтений. Я бы пошел с рейдом 10 лично; Для действительно больших массивов вы можете использовать RAID 50 или 60. Где диск в полосатом наборе может быть защищен с помощью raid 5 или raid 6.

Некоторое хорошее чтение:

Хотя RAID не резервное копирование . в этом случае я думаю, что его определение резервного копирования является правильным. Поскольку исходные данные хранятся на рабочих станциях и других серверах и создаются резервные копии на этом сервере. Что происходит с использованием RAID, чтобы помочь в доступности. Позвольте мне добавить: онлайн резервное копирование не является резервным копированием. Если это резервная копия, ее следует хранить на ленте / дисках и хранить в сейфе где-то далеко от остальных систем. RAID не помогает в этом. Я думаю, что это также зависит от типов используемых дисков, но для базового файлового сервера достаточно RAID 6. Зарезервируйте RAID 10 для высоконагруженного SQL-сервера. @cypher У систем оперативного резервного копирования есть два очень неприятных свойства: 1: можно стереть всю резервную копию с помощью аварий или ошибок в системе резервного копирования, часто не замечая этого. Проверка и восстановление из автономной системы выполняется только для чтения, что снижает риски для ваших резервных копий. 2: Резервное копирование в онлайн-хранилище, скорее всего, не в пожаробезопасном сейфе без внешних подключений. Как только вы подключите электричество 480 В к вашему серверному залу, вы усвоите этот урок. Основная проблема raid заключается в том, что это означает, что диски постоянно используются и подвержены износу, что значительно повышает вероятность их отказа, чем при автономном копировании диска или резервного копирования на ленту. Также это не защищает от повреждения данных или реплицированных удалений. Ленты / автономные накопители могут иметь свои собственные проблемы, единственный надежный способ - многоступенчатый.

[Я предполагаю, что вы довольны снижением производительности RAID6 и озабочены только сбоями]

Вероятность двойного элемента RAID1 прямо умирающий вероятность любого данного диска умирающего, квадрат: P(R1) = P(drive)^2 .

Таким образом, с частотой отказов 5% вы получите:

P(R1) = 0.005^2 = 0.0025 = 0.25%

(Здесь я не уверен насчет математики - это имеет смысл, но это ничего не значит)

Таким образом, шансы потерять любого данного члена R1 составляют 0,25% в год, но у вас есть несколько из них, соединенных вместе, и если кто-то из них умрет, ваш массив мертв. поэтому вам нужно подключить число P (R1) в провал математике R0: P(R10) = 1 - (1 - P(R1))^(n_R1) . Предположим, что у вас всего 8 дисков (и не заменяйте их в случае отказа), так что полоса на 4 R1:

P(R10) = 1 - (1 - 0.0025)^4

Таким образом, у вас есть около 1% шансов потерять RAID10 с 8 дисками с 5% вероятностью сбоев в год.

Проще говоря, вероятность сбоя RAID6 - это вероятность того, что любой конкретный диск умирает в кубе (поскольку для его выхода из строя нужно потерять три диска), например:

P(drive)^3 = (5%)^3 = 0.0125%

Таким образом, для сценария «гибели нескольких дисков» RAID6 имеет примерно 1/80 вероятности сбоя, чем RAID10 с теми же дисками.

К сожалению, жизнь сложна, и вам приходится иметь дело с плохими секторами. Вполне вероятно, что в ваших дисках появляются случайные ошибки, которые остаются незамеченными. Я больше не просто копирую здесь Википедию, но я предполагаю, что вероятность появления плохого сектора на любом диске P(bs) = P(UBER) * bits_written . Если это произойдет, то восстановление после сбоя диска в R1 невозможно, а в R6 сложнее.

Конечно, все, что является спорным, если контроллер RAID6 или драйвер глючит, и вводит ошибки в данных, или портит ваш массив :-)

Где искать свежие, оригинальные идеи? Новые технологии не сразу приходят к конечным пользователям. Сначала они окупаются и обкатываются на профессиональном рынке, служа бизнесу или государству, и лишь затем потихоньку дрейфуют «в массы», появляясь в бюджетных решениях.

В нашу тестовую лабораторию попала на редкость интересная вещица, одно название которой вызвает трепет: плата контроллера RAID-массива LSI LOGIC MegaRAID SCSI 320-1 PCI 64 1ch 64МБ (RAID levels: 0, 1, 50, 10, 5).

Представьте, именно такой абракадаброй кажутся непосвященным пользователям краткие характеристики какого-нибудь системного блока. Но приходит опыт, и цифры обретают смысл.

Плата RAID контроллера LSI LOGIC MegaRAID

Внешний SCSI разъем на плате

Внутренний SCSI разъем на плате

Перед нами типичный образец платы с RAID-контроллером, используемой в серверных решениях. В таких системах обычно устанавливаются дорогие, но надежные жесткие диски с параллельным SCSI интерфейсом и материнские платы с 64-разрядными PCI слотами. Ключевым же на сегодня будет слово RAID и перечисленные уровни: 0, 1, 50, 10, 5.

Что такое RAID?

В переводе с английского «RAID» (Redundant Arrays of Inexpensive Disks) означает «избыточный массив независимых дисков». Этот перевод не совсем дословный, но именно содержащийся в нем смысл является правильным.

Впервые термин RAID появился в 1987 году, когда исследователям из Калифорнийского Университета в Беркли удалось создать действующий массив из нескольких жестких дисков.

Первоначальное предназначение RAID – создание на базе нескольких винчестеров диска большого объема с увеличенной скоростью доступа. Но затем к двум основным целям добавилась третья – сохранение данных в случае отказа части оборудования. Именно эти три кита сделали RAID-массивы столь востребованными бизнесом и военными. Впрочем, за объем, скорость и надежность пришлось платить повышением стоимости и сложности систем хранения данных.

Со временем оборудование для построения RAID массивов стало более доступным, особенно с появлением дешевых решений для IDE/ATA и SATA дисков. Теперь уже не только специалисты по СХД, но и обычные пользователи столкнулись с хитростями построения дисковых массивов.

Оказывается, не так просто найти оптимальное решение одновременно по надежности, емкости и цене. Надо быть готовым к тому, что придется купить не один, а несколько жестких дисков, и емкость как минимум одного из них не будет использоваться. Если речь идет о построении более-менее серьезной системы, потребуется отдельный (лучше специальный) корпус с отдельным (а то и двумя) блоком питания, плата контроллера и соответствующее программное обеспечение.

Не испугались? Значит, пора знакомиться с RAID более подробно.

Пять таинственных слов

В основе теории RAID лежат пять основных принципов – пять таинственных слов. Это Массив (Array), Зеркалирование (Mirroring), Дуплекс (Duplexing), Чередование (Striping) и Четность (Parity).

Массивом называют несколько накопителей, которые централизованно настраиваются, форматируются и управляются. Логический массив – это уже более высокий уровень представления, на котором не учитываются физические характеристики системы. Соответственно, логические диски могут по количеству и объему не совпадать с физическими. Но лучше все-таки соблюдать соответствие: физический диск – логический диск. Наконец, для операционной системы вообще весь массив является одним большим диском.

Зеркалирование – технология, позволяющая повысить надежность системы. В RAID массиве с зеркалированием все данные одновременно пишутся не на один, а на два жестких диска. То есть создается «зеркало» данных. При выходе из строя одного из дисков вся информация остается сохраненной на втором.

Читайте также: