В чем особенность storage памяти

Обновлено: 04.07.2024

Не секрет, что дни накопителей на жестких магнитных дисках (HDD) сочтены, хотя нельзя сказать, что переход на твердотельные накопители SSD произойдет очень быстро. Здесь ситуация примерно такая же, как с электромобилями – всем они нравятся, у них много преимуществ, но всем также известны и их недостатки и ограничения. Поэтому переход на электромобиль – процесс длительный, как и переход с HDD на SSD.

Сравнение SSD и HDD имеет много общих черт со сравнением электромобиля и автомобиля на топливе. Как и автомобиль на топливе, так и HDD, — это вершина инженерного искусства по части точной механики. Напротив, как электромобили, так и SSD, довольно просты по внутреннему устройству, если говорить о механике.

Выгоды от использования накопителей SSD в серверах общеизвестны, однако напомним их еще раз.

Преимущества SSD

  • Высокая скорость записи-чтения, которая у SSD в несколько раз быстрее, чем у HDD, даже самых быстрых, со скоростью вращения 20 тыс. оборотов в минуту. Это очень полезно при записи и чтении больших массивов данных.
  • Число одиночных операций записи-чтения в секунду у SSD гораздо больше за счет возможности выполнения нескольких операций одновременно. В HDD такое невозможно, поскольку для каждой операции нужно перемещать головку записи-считывания.
  • Полное отсутствие шума от накопителя SSD за счет отсутствия движущихся частей. Поэтому сервер с SSD шумит меньше и единственным источником шума в нем остается вентилятор процессора.
  • Стойкость к механическим воздействиям. Например, диск SSD не боится падений на жесткий пол, что для HDD является фатальным событием.
  • Низкое энергопотребление, поскольку в SSD не тратится энергия на вращение шпинделя HDD.
  • Независимость скорости чтения от фрагментации файла. Если файл на HDD сильно дефрагментирован, это заметно влияет на скорость считывания. В SSD такое не наблюдается.
  • Меньшие габариты и вес. Часто можно увидеть, что установочные размеры дисков, как SSD, так и HDD, — одинаковы, однако это объясняется исключительно стандартизацией размеров слотов в серверах. SSD могут быть конструктивно выполнены в корпусах гораздо меньших размеров, чем HDD.

Сравнение размеров HDD и SSD

Сравнение размеров HDD и SSD

Несмотря на такие заметные преимущества, у SSD есть и недостатки.

Недостатки SSD

Основных недостатков SSD всего два, но они часто являются аргументами в пользу выбора HDD.

  • Низкое число циклов перезаписи по сравнению с HDD.
  • Высокая стоимость.

Хотя эти недостатки довольно существенны, очевидно, что решение этих проблем – лишь вопрос времени.

Использование SSD в серверах

Наиболее предпочтительные области для SSD в серверах следующие:

  • Базы данных, с которыми работает большое количество пользователей, например сервер 1C, сервер SQL, CRM, ERP.
  • Хранение и работа с наиболее востребованными данными.
  • Приложения, где требуется высокое быстродействие, низкая задержка передачи данных, например приложения AR/VR, промышленные системы автоматизации и роботизации и т.п.
  • Приложения, работающие на границе сети (Edge Computing), например виртуальные BBU для базовых станций мобильной сети (vRAN).
  • Вычисления в памяти (In-memory Computing).
  • Обработка очень больших объемов потоковых данных в режиме реального времени.
  • Приложения онлайн-трейдинга, где очень важно время реакции на изменения в биржевой ситуации.

Можно назвать и другие области, где применение SSD в серверах гораздо предпочтительное, нежели HDD.

Память класса хранения SCM (Storage Class Memory)

В компьютерной терминологии понятие «память» (memory) относится к оперативной памяти, с быстрым обменом данными с процессором компьютера, данные в которой сохраняются только при наличии электропитания. При выключении компьютера данные в оперативной памяти стираются.

Напротив, понятие «хранение», т. е. система хранения данных, СХД (storage), означает устройство для долговременного хранения данных, где информация сохраняется при выключенном питании. Именно к этому классу устройств относятся как HDD, так и SSD.

SCM (Storage Class Memory) – это нечто среднее между памятью и СХД. Это разновидность SSD, выполненная по технологии NVMe (Non-Volatile Memory express). Сервер может рассматривать эту память как оперативную динамическую память (DRAM). Доступ к данным в памяти SCM происходит гораздо быстрее, чем даже к обычному накопителю SSD, не говоря уже об HDD.

Обычная архитектура процессора, памяти и СХД и архитектура с памятью класса хранения SCM (Storage Class Memory)

Обычная архитектура процессора, памяти и СХД и архитектура с памятью класса хранения SCM (Storage Class Memory)

Существует несколько технологий SCM, как с требованием наличия постоянного питания, так и без него. Скорость доступа к данным в некоторых типах SCM приближается к оперативной памяти DRAM.

Сравнение задержки считывания в разных типах памяти и СХД, цены на единицу емкости

Сравнение задержки считывания в разных типах памяти и СХД, цены на единицу емкости

Параметры TBW и DWPD

Это важные параметры, характеризующие надежность и долговечность диска SSD:

  • TBW (Total Bytes Written): допустимое количество терабайт, которое можно записать на накопитель, стирая и записывая информацию заново. Чем TBW выше, тем более живуч накопитель SSD и тем дольше он сможет проработать без сбоев.
  • DWPD (Drive Writes Per Day): допустимое количество перезаписей полного объема SSD в сутки. Чем выше этот показатель, тем лучше отказоустойчивость твердотельного накопителя. Чем выше требования к интенсивности обмена данными с накопителем при работе сервера, тем выше должен быть данный показатель. DWPD можно вычислить так:

DWPD = TBW / СTB * 365 * 5, где:

  • СTB – объем накопителя в терабайтах;
  • 365 – количество дней в году;
  • 5 – количество лет гарантии.

Показатель DWPD более объективен, потому что при расчете учитывается время гарантии. Для памяти SCM (NVMe SSD) число циклов перезаписи много выше, чем для обычного SSD SATA.

Клиентские и серверные SSD

При использовании в серверах, различают клиентские (потребительские) и серверные SSD. Грубо говоря, клиентский SSD – это обычная флешка, установленная в компьютер. Сложно найти пользователя, который был бы озабочен числом циклов перезаписи, который выдерживает его SSD-диск в компьютере. Никакой пользователь не израсходует допустимое число циклов перезаписи обычного потребительского SSD, не только за все время работы на данном компьютере, но и за всю свою оставшуюся жизнь.

Напротив, в серверных SSD в дата-центрах, в особенности, для использования SSD в физическом сервере, на котором работают виртуальные серверы, количество циклов полной перезаписи диска SSD может приближаться к показателю DWPD. А это уже чревато ранним выходом накопителя SSD из строя.

Поэтому клиентские SSD не рекомендуется использовать в серверах (в особенности в дата-центрах). Серверные SSD, предназначенные для дата-центров, можно использовать и в качестве клиентских, но это нецелесообразно экономически.

Есть желающие использовать клиентские (потребительские) SSD в серверах, поскольку, как они считают, что если производительность SSD высокая, то и в сервере они будут работать так же хорошо, как и в обычном клиентском компьютере. Поначалу будут, но долго не проработают.

Клиентский компьютер и сервер – вещи разные.

Клиентский SSD предполагает обслуживание одного пользователя, даже если одновременно запущены несколько приложений. Нагрузка на SSD в клиентском компьютере – периодическая и большую часть времени диск будет простаивать. Если на запрос пользователя ответ от SDD придет с небольшой задержкой, то это либо просто незаметно, либо не критично.

Серверы и СХД предназначены для одновременного обслуживания множества пользователей, поэтому даже небольшая задержка ответа на запрос от серверного SSD сделает работу с сервером затрудненной, а если пользователей – сотни, то даже неприемлемой. Поэтому для серверных SSD задаются параметры, рассчитанные на одновременное обслуживание большого количества пользователей.

Не вдаваясь в технические подробности, скажем, что в серверных SSD доступ к ячейкам памяти может производиться через 8–16 каналов, каждый из которых может иметь от 16 до 64 подканалов. В клиентских SSD имеются лишь 2–4 канала с 4–8 подканалами.

Малое количество каналов и подканалов у клиентских SSD до некоторой степени компенсируется кэшированием. Однако после наполнения небольшого по объему кэша происходит деградация производительности клиентского SSD, после чего она определяется количеством каналов, которое у клиентских дисков небольшое.

Именно поэтому производительность клиентских SSD в многопользовательской среде сильно падает. А цены серверных SSD гораздо выше, чем клиентских.

Например, потребительский накопитель Micron M500DC емкостью 800 ГБ имеет показатель TBW 2500 ТБ. Это означает, что такой накопитель позволяет перезаписать свой полный объем в 800 ГБ примерно три тысячи раз. Для накопителей потребительского класса это вполне нормально. Редко какой пользователь выберет этот объем перезаписи за весь срок службы компьютера. А вот в корпоративном сервере CRM, к которому обращается множество пользователей, объем перезаписи в 2500 ТБ будет выбран за несколько дней, а возможно и часов.

Что произойдет дальше? Дальше потребительский SSD, на который взвалили такую огромную нагрузку, перейдет в режим чтения Read Only. То есть записать в него информацию станет невозможно.

Технологии SSD для серверов

Если кому-то интересно разобраться в технологиях SSD (а их есть много разных), применяемых в серверах, можно прочитать этот раздел. Если неинтересно, можно пропустить.

SLC, MLC, TLC, QLC

Первые SSD создавались на основе транзисторных накопителей, в которых одна ячейка хранит один бит, закодированный при помощи двух уровней заряда – заряжено или разряжено. Такая технология была названа SLC (Single level cell) — одноуровневая ячейка.

Такая технология предполагала, что чип памяти SSD – планарный, одноуровневый, как и большинство чипов для других микросхем. SLC позволяет производить на каждой ячейке до 100 тысяч операций записи-стирания.

Технологии SSD (изображение: Micron)

Технологии SSD (изображение: Micron)

Затем, по мере уплотнения емкости в чипах SSD, появилась технология с многоуровневыми ячейками MLC (Multi Level Cell). Хотя уровней в ней было всего два, а не «много». Соответственно, в такой ячейке можно разместить два бита. Распознаваемых уровней заряда в MLC – четыре (00, 01, 10, 11). То есть MLC дала возможность вдвое повысить емкость. Однако число циклов перезаписи в такой структуре сократилось на порядок – со 100 до 10 тыс. циклов. Но и удельная стоимость на гигабайт в MLC также значительно уменьшилась.

Следующим шагом была технология TLC (Triple Level Cell), где в ячейке можно различать 8 уровней заряда или 3 бита (тремя битами можно закодировать цифры от 0 до 7, т. е. восемь цифр). Это дало возможность увеличить рост емкости чипа на 50 %. Однако и допустимое число циклов перезаписи сократилось до трех тысяч.

Затем была изобретена технология 3D NAND, т. е. планарную, двумерную структуру 2D NAND SSD решили сделать трехмерной.

Сравнение 2D NAND и 3D NAND (изображение: NVMdurance.com)

Это позволило перейти к следующему этапу – технологии QLC, которая позволяет размещать в ячейке до 4 битов, то есть распознавать 16 уровней заряда. Это дало возможность повысить емкость чипа еще на 33 %, однако число циклов перезаписи сократилось до одной тысячи, что для серверных SSD корпоративного класса совершенно неприемлемо. Средний сервер организации съест ресурс циклов перезаписи ячеек очень быстро, после этого память нужно будет менять.

Причем по технологии 3D NAND можно изготавливать как чипы TLC, так и QLC.

Форм-факторы SSD: SATA, M.2, NVMe и PCI-E

Практически у всех материнских плат компьютеров есть физический интерфейс для накопителя SATA. (см. рисунок ниже). Но не на всех имеется разъем под компактный SSD-накопитель M.2, который сейчас стал появляться даже у ноутбуков.

Форм-факторы SATA, mSATA и M.2

Форм-факторы SATA, mSATA и M.2

В чем различия M.2 SATA и M.2 NVMe

M.2 — это форм-фактор. Накопители M.2 могут быть в версиях SATA и NVMe. Энергонезависимая память (Non-Volatile Memory) NVMe (NVM Express) — это открытый стандарт, который позволяет модулям SSD работать с максимальной скоростью чтения-записи, на которую способен их чип NAND.

Это дает SSD работать непосредственно через интерфейс PCIe, а не через SATA, который начинает устаревать. То есть NVMe — это описание шины подключения, а не новый тип флэш-памяти. Он также не связан с форм-фактором, поэтому накопители NVMe могут иметь форм-факторы M.2 или PCIe.

Жесткий диск HDD с интерфейсом SATA и скоростью 7200 об/мин обеспечивает скорость около 100 МБ/с в зависимости от возраста, состояния и степени фрагментации. SSD с интерфейсом SATA III обеспечивает максимальную пропускную способностью 600 МБ/с, SATA II — 300 МБ/с.

SSD NVMe обеспечивает скорость записи до 3500 МБ/с, то есть почти в 6 раз больше, чем у SATA III.

3D XPoint

Отдельного рассказа заслуживают накопители Intel Optane. Технология SSD 3D XPoint была анонсирована корпорациями Intel и Micron в июле 2015 года. Устройства компании Intel, использующие данную технологию, выпускаются под торговой маркой Optane, а устройства Micron будут использовать марку QuantX.

Накопитель Intel Optane с технологией 3D XPoint

Накопитель Intel Optane с технологией 3D XPoint

Технология 3D XPoint может обеспечить практически неограниченный ресурс циклов перезаписи, по крайней мере, очень высокое значение этого показателя. Это достигается за счет особой технологии: изменения фазового состояния вещества, когда материал ячейки памяти при нагреве током меняет свое состояние из аморфного (высокое сопротивление) в кристаллическое (низкое сопротивление) и обратно. Это совершенно новый принцип, не связанный с хранением заряда в ячейке, как у предыдущих поколений SSD NAND.

Чипы 3D XPoint емкостью 16 Гбайт обеспечивают плотность памяти в 0,62 Гбит/мм 2 . Для сравнения, плотность памяти в микросхемах 3D NAND TLC достигает 2,5 Гбит/мм 2 . По емкости эта память проигрывает 3D NAND для SSD.

Очевидно, что использование 3D XPoint в виде модулей памяти SCM весьма перспективно для подсистем памяти серверов.

Преимущества 3D XPoint можно увидеть в такой инфографике:

Преимущества SSD 3D XPoint (источник: gagadget.com)

Заключение

Выбор подходящего SSD для определенного сервера в определенном развертывании может быть сложной задачей, поскольку существует множество моделей SSD корпоративного класса, с разными показателями производительности, форм-факторами, ресурсами и емкостью. С другой стороны, есть много разных серверов для разных приложений. Поэтому задача выбора серверного SSD является очень многофакторной.

При оценке пригодности серверных SSD для конкретного использования сервера не следует ограничиваться только значениями IOPS или пропускной способности. Необходимо учесть также показатель качества обслуживания конечных пользователей, чтобы гарантировать выполнение соглашений SLA для приложений, производительность для реальных рабочих нагрузок, а также вид форм-фактора, обеспечивающего «горячую» замену в отказоустойчивых архитектурах.

Поэтому при выборе SSD для сервера желательно воспользоваться консультациями предметных специалистов, хорошо разбирающихся в технологиях памяти и СХД, а также в приложениях серверов.


За все время существования теории вычислительных машин и систем справедливым оставалось одно утверждение: процессоры гораздо более производительные и дорогие, чем устройства хранения данных. Тот факт, что CPU способен обслуживать множество запоминающих устройств разом, оказал значительное влияние на разработку аппаратного и программного обеспечения для систем самых разных размеров.

Действительно, в таких книгах, как «Вычислительные системы: взгляд программиста» («Computer Systems: A Programmer's Perspective») Рандала Брайанта (Randal Bryant) и Дэвида О'Халларона (David O'Hallaron) делается упор на иерархию памяти и её влияние на разрабатываемые программы.

Однако дата-центрам и разработчикам ПО нужно готовиться к грядущим изменениям. Появление высокоскоростных энергонезависимых устройств хранения информации, обычно называемых аббревиатурой SCM (Storage Class Memories), пошатнет привычные устои. SCM постепенно набирают популярность, однако для работы с ними требуется выделять один или сразу несколько многоядерных процессоров, чтобы совладать с их производительностью (сотни тысяч IOPS).

Скорость работы долговременных хранилищ всегда была сильно ниже, чем скорость работы CPU, и эта разница только увеличилась за период с начала 90-х до начала 00-х годов. Процессоры стабильно улучшались и совершенствовались, а производительность механических дисков оставалась неизменной – развитию препятствовала физика. На протяжении десятилетий, чтобы сократить этот разрыв и избежать простоев процессора, придумывались различные схемы и методики.

Одним из способов является кэширование. В современных системах кэширование выполняется на всех системных уровнях: процессор кэширует RAM, операционные системы кэшируют целые дисковые секторы и так далее.

Другие способы позволяют в буквальном смысле разменять процессорное время на производительность. Например, сжатие и дедупликация уменьшают размеры обрабатываемых данных, и получается, что «быстрая» память как бы увеличивается в размерах, но за это приходится платить вычислительными ресурсами.

Сжатие остается основной техникой, используемой в системах хранения корпоративного уровня, а также средах, работающих с большими данными. Такие инструменты, как Apache Parquet реорганизуют и сжимают данные на дисках, чтобы уменьшить время чтения.

От всех этих недостатков освобождены флеш-хранилища. Эта технология не нова, а SAS и SATA SSD можно приобрести уже лет десять как. Однако SCM переводит флеш-устройства на новый уровень: флеш-память подключается к PCIe-шине, вместо медленных шин SAS и SATA, что увеличивает скорость обмена данными.

Более того, зарождаются такие SCM, как например NVDIMM. NVDIMM производится в виде DIMM-модулей и, по сути, представляет собой гибридную память, объединяющую оперативную память DRAM и флеш-память NAND.

В обычных условиях модули NVDIMMвыполняют функцию обычной DRAM-памяти, но в случае сбоя или выключения системы данные из DRAMперемещаются в энергонезависимую флеш-память, где могут храниться неограниченно долго. Когда компьютер возобновляет работу, данные копируются обратно. Такой подход позволяет ускорить процесс запуска машины и снизить вероятность потери важных данных.


На сегодняшний день SCM с интерфейсом PCIe позволяют добиться увеличения производительности в 1000 раз (100k IOPS против 100 IOPS). К сожалению, это ведет к значительному увеличению в стоимости: SCM стоят в 25 раз дороже обычных HDD ($1,50/ГБ против $0,06/ГБ). Устройства корпоративного класса стоят от $3000 до $5000 каждое.

Чтобы максимизировать эффективность использования дорогих SCM, системы хранения должны постоянно обеспечивать их работой, то есть держать их занятыми. Получается, что мы не можем просто заменить магнитные диски – нам придется перерабатывать аппаратные системы и программное обеспечение.

К этому вопросу нужно подходить осторожно, поскольку слишком большое количество флеш-устройств приведет к значительным затратам денежных средств, а слишком малое их количество – к сложностям обращения к ним. Найти правильный баланс не так уж и просто.

Также стоит помнить и о временном разделении ресурсов. На протяжении многих лет для взаимодействия жесткого диска и процессора использовались прерывания. Для ядра, работающего на частотах, измеряемых гигагерцами, не составляет труда обслужить прерывание каждые несколько секунд. Одно ядро может управлять десятками или сотнями дисков, не рискуя «захлебнуться». Однако с появлением низколатентных устройств хранения этот подход больше неприменим.

Эта модель должна серьезно измениться. Серьезный прирост в производительности получили не только устройства хранения данных – ускорение работы сетевых устройств также имело место: сначала до 10G, потом до 40G, затем до 100G. Может удастся «подсмотреть» решение в этой сфере?


Однозначного ответа дать не получится, поскольку слишком велика разница в ускорении: сети стали быстрее в тысячу раз, а запоминающие устройства – в миллион. Более того, при работе с памятью часто приходится поддерживать сложные функции сжатия, кодирования и дедупликации, потому методики оптимизации, применяемые для работы с пакетами, скорее всего, не подойдут.

В сетях для снижения латентности применяется способ, когда всеми пакетами управляет приложение в обход ядра. Однако между сетями и устройствами хранения данных есть разница: сетевые потоки независимы и могут обрабатываться параллельно на нескольких ядрах, в случае ЗУ все запросы придется координировать.

Очевидно, что это непрактично. Один контроллер неспособен управлять доступом к огромному количеству SCM-устройств одновременно. Аппаратное обеспечение будет использоваться в пол силы, потому нужен иной подход.

Требования нагрузки к емкости и производительности не совпадают с аппаратными возможностями, что ведет к ограничениям в использовании высокоскоростных дисков. Например, данные объемом 10 ТБ с ожидаемой нагрузкой в 500k IOPS задействуют лишь половину возможностей дисков, если будут храниться на SCM-устройствах объемом в 1ТБ, способных обрабатывать до 100k IOPS каждый.

Однако нужно помнить о том, что большая часть данных не является «горячей», поэтому неэффективно хранить их все на высокоскоростных флеш-устройствах. Во многих случаях нагрузка согласуется с распределением Парето: 80% всех обращений адресовано 20% данных.

Гибридная система с различными уровнями хранилищ (с различными характеристиками производительности) является хорошим решением для смешения «холодных» и «горячих» данных, когда SCM-устройства выступают в качестве кэша для медленных дисков. Но нужно помнить, что шаблоны доступа со временем изменяются – надо своевременно на это реагировать и перемещать данные.

В грамотно построенных системах такой способ позволяет эффективно использовать аппаратное обеспечение без снижения производительности. Однако системы должны иметь гибкие политики, которые бы запрещали активным, но низкоприоритетным задачам вмешиваться в работу бизнес-критических приложений. Грамотная реализация и отладка этих механизмов – это совсем не тривиальная задача.

Так что же нас ждет в будущем?

Как было сказано выше, уже есть разработанные SCM-устройства. PCIe SSD – наиболее известный тип SCM и уже оказал значительное влияние на инфраструктуру дата-центров. Вторым примером может служить NVDIMM, которая имеет характеристики производительности, сравнимые с DRAM. Такие устройства уже доступны сегодня и продолжают развиваться.

SCM-технологиями занимается компания HP. Их проект под названием The Machine не что иное, как попытка разработать новую компьютерную архитектуру на мемристорах. Существование мемристора – четвёртого базового компонента электрических схем было предсказано в 1971 году Леоном Чуа (Leon O. Chua), однако лабораторный образец запоминающего элемента был создан только в 2008 году коллективом учёных во главе со Стэнли Уильямсом (Stanley Williams) в исследовательской лаборатории фирмы Hewlett-Packard.

Этот пассивный элемент способен запоминать собственное состояние. Можно сказать, что это резистор, сопротивление которого изменяется в зависимости от протекающего через него заряда. Когда элемент обесточивают, измененное сопротивление сохраняется.

В настоящее время ведутся разработки коммерческой реализации мемристора. Как только это произойдет, появится возможность для создания новых видов памяти, способных помимо хранения данных еще и обрабатывать их.

Что касается The Machine, то в ней нет границы между оперативной памятью и постоянным хранилищем данных. Вся память представляет собой оперативную. Это нивелирует проблемы, связанные с передачей информации между устройствами, работающими с разной скоростью.

Думается, что SCM-технологии призваны побороть неэффективность, возникающую при «общении» медленной и быстрой памяти. Тем интереснее наблюдать за происходящим: как новые разработки затронут все уровни инфраструктурного стека. Все еще только начинается.

«Разные типы дисков могут требоваться для решения различных задач. Использование дисков различных типов может быть оправданным при создании многоуровневых систем хранения данных – данные, которые часто используются приложениями, можно размещать на более быстрых дисках.

К примеру, если существует сервис, который активно работает с базой данных, то ее имеет смысл перенести на отдельный SSD-диск – это поможет оптимизировать скорость ее работы. При этом, саму операционную систему логично оставить на более медленных дисках. Одновременное использование различных типов дисков позволяет сделать общее инфраструктурное решение более гибким, эффективным и оптимизированным по цене.

Что касается новых разработок в сфере твердотельных накопителей, то в прошлом году компании Intel и Micron анонсировали 3D XPoint (произносится как «кросспойнт») – безтранзисторную трехмерную архитектуру и заявили, что срок эксплуатации и скорость работы таких ЗУ превысит возможности памяти NAND в 1000 раз. Если это решение станет коммерческим, то, я думаю, оно с большой долей вероятности будет использоваться в центрах обработки данных для хранения часто запрашиваемых «горячих» данных»

Мнение Джорджа Крампа (George Crump) из Storage Switzerland:

«SCM – это новый тип хранилища, которое может стать промежуточным звеном между высокопроизводительной DRAM и дешевыми HDD. SCM-память способна обеспечить скорость считывания, близкую к скорости чтения DRAM, и скорость записи, во много раз превышающую возможности жестких дисков.

Это стало возможным благодаря интерфейсу PCIe, через который флеш-хранилище подключается напрямую к процессору. Однако не любой SSD-накопитель, подключенный по PCIe, является SCM-устройством.

Некоторые поставщики в погоне за производительностью устанавливают несколько контроллеров на свои карты, каждый из которых отвечает за свою область флеш-памяти. На первый взгляд, это кажется здравой идеей, однако в этом случае у контроллера нет возможности записывать или читать блоки, которые находятся за пределами его компетенции.

Если блок большой – это, наоборот, может негативно повлиять на скорость работы. Эта и другие проблемы с производительностью, возникающие из-за неэффективности существующих интерфейсов, тормозят процесс адаптации технологии»

Мнение Скотта Дэвиса (Scott Davis), технического директора Infinio:

«SCM-технологии станут доступны для коммерческого использования не раньше конца 2016 года.

Скорее всего, это будет ранняя реализация технологии 3D XPoint от Intel. HP и SanDisk также анонсировали, что работают над совместным проектом, однако их продукт, вероятно, выйдет на рынок не раньше начала 2017 года.

Стоит учитывать, что, как в случае со многими новыми технологиями, SCM-устройства первое время будут обладать ограниченной областью применимости. Препятствием для выхода на широкий рынок станет стоимость устройств»

Картинка не выражает позицию компании и является личным видением автора, не обязательно связанным с темой данного текста, аминь

Как вы наверное помните, НРЕ давно вкладывается в тему новых типов хранилищ данных (конечно, The Machine) и в оптимизацию доступа к хранилищам (наше членство в консорциуме Gen-Z).

Цель этого движения — ускорить работу приложений наших заказчиков. Причем движение это многоуровневое: пока куется совершенно новая архитектура вычислительных систем The Machine (т.н. памяте-центричная архитектура), мы понимаем, что ускоряться нужно уже сейчас. Давайте посмотрим что можно сделать сегодня, и что появится у HPE завтра. Подсказка — речь пойдет о сильном ускорении наших СХД 3PAR и Nimble с помощью умного и относительно бюджетного кэширования на Storage Class Memory (SCM) в форме Intel Optane.

Во-первых, установим границы исследуемой задачи. Нам в этом посте не интересны высокопроизводительные вычисления со своей спецификой и не интересны задачи, требующие исключительно внутри-серверного быстрого хранилища. Последние — это несомненно тоже тема для Intel Optane и вообще SCM, но такие задачи зачастую специфичны, плохо поддаются виртуализации и соответственно консолидации. Мы поговорим о задачах и приложениях, которые вполне уживаются с внешней СХД класса 3PAR, Nimble или MSA (хотя MSA-ки трогать не будем тоже).

  • посмотреть что сдерживает приложение сейчас. Возможно дело совсем не в СХД, а в ожидании процессора, во внутренней логике работы с данными, в неоптимально написанных запросах;
  • если задержки большие со стороны ожидания данных (IO), то сначала стоит проверить соблюдены ли все рекомендации по настройке связки приложение-ОС-драйверы (SCSI, HBA, т.п.)
  • возможно дело в сети SAN (Ethernet, FC);
  • возможно дело все-таки в СХД. Где в СХД? В железе контроллера (что с кэшем, какова загрузка процессора), в ОС контроллера и драйверах, в шине данных, в дисках.

image

Все понятно, берем хранилку с «NVMe-дисками». Подождите, сколько стоит? И надо купить новую СХД, я не могу апгрейдить свою текущую? Ну, надо так надо…

А можно ли по-другому все-таки? Мы в НРЕ считаем, что не только можно, но и нужно. И вот почему:

image

Дело в том, что большинство NVMe SSD на рынке сейчас — это тот же самый тип носителя, NAND-flash, только подключенный к контроллеру не по Serial Attached SCSI (SAS) протоколу, а по новому протоколу NVMe. Новый протокол без сомнения прекрасен, и вот немного фактов:

  • доступно 64 000 очередей с 64 000 потоков каждая — IOPS выше крыши
  • контроллер прямо в CPU — ниже нагрузка на процессор
  • каждое ядро процессора видит каждый SSD напрямую — низкие задержки

При полной замене SCSI-протокола на всем пути от приложения до дисков возможно значительно снизить задержку доступа. Но что предлагают нам маркетологи сегодня? «NVMe-диски». Т.е. вся цепочка до самого контроллера СХД остается та же — SCSI. А потом контроллер просто перепаковывает SCSI в NVMe и так общается с подключенными NAND SSD.

Результат на графике выше — выигрыш в задержке минимальный. Хотя выигрыш по пиковым IOPS действительно может быть очень заметен. Традиционная аналогия: вам нужна машина, которая может быстро разгоняться для обгона за 5 секунд, или машина, которая в идеальных условиях может за 10 минут разогнаться до 300 км/ч? Оба варианта хорошие, но чаще выбирают первый.

Реальность в том, что прирост от NVMe NAND сегодня мало заметен для реальных приложений, и на наш взгляд совсем не стоит той разницы в цене и проигрыше в доступной емкости по сравнению с SAS SSD.

Что HPE предлагает вместо простой замены «последней мили» с SAS на NVMe — использование подключенных по NVMe совершенно новых накопителей Intel Optane в качестве кэша на чтение в контроллерах наших СХД 3PAR и Nimble.

image

(И арифмометр и админа на фото зовут Феликс, но разница огромна!)

Почему мы решили пойти по этому пути:

    так мы можем предложить нашим заказчикам обновить уже закупленные СХД (конкретно 3PAR 9450, 20450, 20850 и Nimble AF60 и AF80 — все топовые all-flash)

image

image

image

Да, кстати, знакомы с HPE InfoSight? С помощью этого инструмента вы всегда знаете где искать задержку. Например вот так:

image

(Нашедшим задержку просьба обращаться в нашу веру.)

Пора подвести итог: если вы являетесь счастливым обладателем 3PAR 9000 или 20000, то вы можете заказать 3PAR 3D Cache на базе Intel Optane прямо сейчас. Если вы присматриваетесь к массиву Nimble All-flash — берите, т.к. это надежная база для защиты инвестиций в будущем. Начните с SAS NAND SSD сейчас, подключите All Flash Turbo-кэш на базе SCM позже, потом поменяйте диски на NVMe.

Ранее производители систем хранения данных (СХД) использовали энергонезависимые накопители Storage Class Memory (SCM) как начальный дисковый кэш, но сейчас они активно применяются для постоянного хранения данных. В этой роли SCM вполне успешно конкурируют с флеш-хранилищами.

Рассказываем о Storage Class Memory, бизнес-задачах, где внедрение этой технологии будет максимально полезным, и лучших СХД со слоем SCM, которые оптимально подойдут для ускорения рабочих приложений.

Технология Storage Class Memory, как высокоскоростной болид, «разгоняет» бизнес-приложения и минимизирует задержки

Особенности технологии Storage Class Memory

SCM – это энергонезависимая память, появление которой расценивается многими IT-аналитиками как одно из революционных событий десятилетия. SCM переводит флеш-накопители на новый уровень: флеш-память подключается к PCIe-шине вместо медленных шин SAS и SATA, что существенно увеличивает скорость обмена данными и позволяет снизить задержки до 0,2 мс.

Технология Storage Class Memory – совместная разработка корпораций Intel и Micron, которая была предложена в качестве альтернативы NAND

В сочетании с новейшими протоколами хранения – NVMe и NVMe-oF – Storage Class Memory обеспечивает сокращение времени отклика системы в 2 раза. То есть главный плюс SCM – прорыв в производительности, минус же в том, что технология пока еще весьма дорогая, поэтому ее сложно использовать для всех данных.

Приложения, которым SCM даст максимальную пользу

Современные пользователи, избалованные высокоскоростным интернетом и имеющие постоянную нехватку времени, ждут мгновенного отклика на свой запрос. Чем быстрее реакция на обращение клиента, тем выше степень его удовлетворенности, а значит и уровень лояльности к поставщику услуги. Даже пара секунд, умноженная на сотню пользователей, выливается в минуты ожидания, которые могут вызвать тревогу и раздражение у людей. Устройства с SCM минимизируют задержки, не допуская временных потерь.

На валютном или фондовом рынке «время равно деньги». Минимальная задержка – гарантия быстрого подтверждения и заключения сделки. Даже секундное промедление может обернуться миллионными потерями, поэтому биржевым приложениям для сохранения конкурентоспособности необходимо использовать быстродейственные накопители SCM.

Крупные базы данных и программы SQL и ERP значительно выигрывают от увеличения производительности. С наращиванием объема бизнес-информации БД разрастаются, становятся более распределенными, должны откликаться на запросы из большего количества мест. Даже незначительное замедление в обработке данных чревато снижением общей производительности. Устройства с поддержкой SCM «разгоняют» БД без значительных изменений в IT-инфраструктуре.

Splunk и аналогичные приложения работают с данными, собранными из множества источников: интернет-сайтов, датчиков, различных устройств, то есть по всей IT-инфраструктуре бизнеса. Подобные приложения располагают «горячими/теплыми» данными, к которым идет большинство пользовательских запросов. Быстрый поиск в таких системах предельно важен для анализа и визуализации в реальном времени. Устройства с SCM ускоряют приложения с Big Data до немыслимого ранее уровня. Эта технология в совокупности с ИИ и машинным обучением обеспечивает консолидацию рабочей нагрузки.

  1. Приложения мониторинга и аналитики

SCM ускоряют работу приложений для отслеживания мошеннических операций, где скорость реагирования предельно важна. А также приложения маркетинговой аналитики, чувствительные ко времени выполнения запросов. Здесь игра идет на микросекунды, а ценность операционных улучшений оказывается существенно выше затрат на оборудование.

Лучшие предложения рынка: СХД со слоем SCM

Лидерами в предложении инновационных решений являются Dell Technologies, IBM и Hewlett Packard Enterprise (HPE).

Революционное решение PowerStore от Dell EMC со слоем SCM

Решения Dell Technologies:

    –адаптируемая инфраструктурная платформа, которая сочетает преимущества передового оборудования для хранения данных с гибкостью и простотой современного ПО. Обеспечивает до 7 раз большую производительность, чем системы-предшественницы.
  • Dell EMC PowerMax NVMe Storage – хранилище с высокоскоростными интеллектуальными функциями для поддержки критически важных рабочих нагрузок. Является самым быстрым в мире массивом хранения данных, поддерживает сквозной протокол NVMe, SCM, машинное обучение в реальном времени и обеспечивает скорость до 350 ГБ в секунду.
  • Решения IBM: – устройство в форм-факторе 2U с протоколом NVMe и минимизацией задержек SCM. Обеспечивает бизнесу максимум возможностей технологии IBM FlashCore® и управление хранением на основе прогнозов ИИ. Оптимальный вариант для мультиоблачной среды. – мощные флеш-массивы и гибридные массивы хранения в форм-факторе 2U для корпоративных СХД среднего уровня с возможностями систем хранения высокого класса. – корпоративные флеш-массивы с поддержкой мультиоблака, сквозным применением NVMe и минимальной задержкой SCM для бизнеса средних и крупных размеров. – сверхпроизводительная система хранения данных для самых требовательных сред. Стоечное решение, объединившее технологии NVMe, SCM, IBM FlashCore® и ИИ.

FlashSystem 9200 – оптимальное решение от IBM для ускорения бизнеса любого размера

Решения от HPE:

    – базовый флеш-массив, поддерживающий требования систем SCM и NVMe. Обеспечивает на 65 % более высокую производительность и в 2 раза лучшую масштабируемость по сравнению с предыдущими моделями.
  • HPE Nimble Storage AF80 – настраиваемый массив, который обеспечивает максимально эффективную емкость на терабайт необработанной флеш-памяти. Оптимальное решение для самообслуживания с высоким уровнем корпоративной безопасности. – СХД, позволяющая консолидировать рабочие нагрузки для файлов и облаков на флеш-массиве корпоративного класса без ущерба для производительности, масштабируемости и отказоустойчивости. – флеш-массив корпоративного класса с производительностью свыше 3,8 млн операций «ввод-вывод» в секунду, задержками менее 1 мс, высокой плотностью хранения и возможностью расширения полезной емкости до 20 Пбайт и более. - платформа для критически важных приложений, где стоимость простоя очень велика, и ее можно посчитать При разработке СХД Primera компания НРЕ придерживалась принципа золотой середины, стремясь сделать продукт на основе самых передовых технологий и при этом создать потенциал для развития как минимум еще на 10 лет.

Передовая СХД Primera от HPE – новый стандарт бизнес-критичных систем хранения

Системы, способные интеллектуально оптимизировать и распределять данные, – это то, чего ждал современный бизнес. Согласно расчетам IT-аналитиков, в таких системах 90 % операций «ввод-вывод» осуществляется за счет 10 % данных. Это позволяет минимизировать время откликов для пользователей и одновременно консолидировать IT-инфраструктуру, сократив ее размер.

За технологией Storage Class Memory будущее, но сначала она станет использоваться только для обслуживания специфических приложений, особенно чувствительных к времени отклика. По мере падения цены на инновацию область применения устройств с SCM существенно расширится.

Читайте также: