Hp smart array s100i sr gen10 не видит диски

Обновлено: 08.07.2024

При попытке выполнить установку устаревшей операционной системы Windows Server 2012 R2 на новую серверную платформу HPE ProLiant DL560 Gen10 с RAID-контроллером HPE Smart Array P408i-a SR Gen10 можно столкнуться с тем, что инсталлятор ОС не может обнаружить диски, пригодные для установки ОС. В этой заметке рассмотрим пару простых примеров решения подобной проблемы.

При этом в окне выбора дисков для установки ОС не будет видно логических дисков на RAID-массивах, созданных до начала установки ОС на контроллере Smart Array.

Решение данной проблемы в данной ситуации, что называется "на поверхности". В случае с контроллером Smart Array P408i-a SR нам потребуется с сайта HPE скачать драйвер HPE Smart Array Gen10 and Gen10Plus Controller Driver for Windows Server 2012 R2, Windows Server 2016, and Windows Server 2019. Загруженную актуальную версию программы установки (в нашем случае файл cp044563.exe – версия 106.278.0.1043 от 19.04.2021) распаковываем любым архиватором, как архив. Каталог с распакованным драйвером записываем на съёмный USB-накопитель и подключаем этот накопитель к серверу. Возвращаемся в программу установки ОС и, используя последовательно кнопки "Load driver" > "Browse", указываем размещение каталога с распакованным драйвером на съёмном носителе.

Windows Server 2012 R2 Setup - Browse driver

В списке совместимых с нашим оборудованием драйверов выберем драйвер RAID-контроллера

Windows Server 2012 R2 Setup - Select HPE Smart Array driver

После этого в перечне накопителей, на которые может быть установлена ОС, должны появиться логические диски на RAID-массивах, созданных на контроллере Smart Array.

Windows Server 2012 R2 Setup - Select RAID Volume for OS installation

Однако, моя практика нескольких развёртываний ОС показала, что и на данном этапе нас могут ожидать некоторые непонятные ситуации.

Например, может получиться так, что даже после загрузки драйвера RAID-контроллера без явного появления каких-либо ошибок, список дисков, пригодных для установки ОС, может оставаться пустым. В таком случае можно попробовать воспользоваться кнопкой возврата на предыдущий шаг инсталлятора (синяя стрелка в левом верхнем углу окна) и повторить процедуру загрузки драйвера. Пару раз такой странный способ помогал.

В другом примере можно отметить ситуацию, когда драйвер RAID-контроллера Smart Array был успешно загружен, в перечне дисков появились логические диски для установки ОС, но при их выборе возникала ошибка (при этом дальнейшая установка ОС была невозможна):

Эксперименты показали, что данная ошибка в инсталляторе ОС может проявляться плавающим образом на разных серверах однотипной аппаратной конфигурации. В случае возникновения подобной ошибки можно проанализировать то, какие ещё в сервере есть Storage-контроллеры, с которыми может быть связана загрузка ОС. Например, в моём случае в сервере был дополнительно установлен оптический контроллер PCI-E HPE StoreFabric SN1200E FC HBA (Emulex LPe31002). Свидетельства ещё одного странного способа решения проблем с инсталлятором Windows Server говорят о том, что в такой ситуации перед началом установки ОС можно попробовать исключить из конфигурации сервера подобный Storage-контроллер, оставив в сервере RAID-контроллер Smart Array в "гордом одиночестве". FC-контроллер можно извлечь из сервера на время установки как физически, так и просто временно отключив его в настройках BIOS сервера. Для этого перейдём в раздел BIOS/Platform Configuration (RBSU) > PCIe Device Configuration, выберем соответствующее устройство…

HPE ProLiant Gen10 BIOS Platform Configuration RBSU - Select PCIe Device

… и выполним его отключение.

HPE ProLiant Gen10 BIOS Platform Configuration RBSU - Disabled PCIe Device

Сохраним настройки BIOS, снова запустим программу установки Windows Server и, возможно, уже не столкнёмся с ошибкой 0x80300001. А уже после успешного окончания процедуры установки ОС, можно вернуть в работу FC-контроллер в настройках BIOS.

При работе с железом, потребительского ли, бизнес сегментов - не важно, сложно представить что-то, вызывающее столько "любви и обожания" к производителю, как "белые списки" совместимого оборудования и расходников.

Вроде бы все хорошо: никаких препятствий для работы устройства нет, но при подключении получаем что-нибудь в духе "ваше устройство не поддерживается, не хочу с ним работать", а то и вовсе гордое молчание и отсутствие признаков жизни.

Бывает так, что рейд-то перестроился, а сервак продолжает гореть красным, и статус "degraded" так никуда и не делся. С этой проблемой в последнее время я сталкивался довольно часто.

Итак. У нас есть сервер производства HP восьмого, девятого и даже десятого поколений. DL360, 380, бывает и на лезвиях BL460c, BL660 и так далее. Raid-контроллер, соответственно, Smart Array P420, P222, P820, P440ar, P840 и иже с ними. Есть диск. И есть описанная выше ситуация.

Так это выглядит на экране:


А вот так в сервере:


Здесь, на верхнем диске, наблюдается зацикленная круговая индикация и, при сборке массива, он не помечается синим.

Сервер подсвечивается красным светодиодом, в ILO висит ошибка, статус "degraded":


И degraded он, разумеется, по стораджу:




Если зайти в SSA и посмотреть на диск, то увидим еще одно подтверждение.


Забавно, ведь оба диска оригинальные. Здесь хорошо видно голограмму:


В чем же дело? Ответ прост: в салазках.

С восьмого поколения в Хьюлете решили, что салазка - это не просто кусок пластика и металла со световодами, а сложное техническое решение.

Собственно, оригинальная салазка только на одном диске. Китайские работают по схеме великого рэндома: из десятка нормальными могут оказаться штук пять.

Получается, что виноват не HP, а китайцы, и все добрые слова уходили не по адресу.

Вот здесь хорошо видна разница поведения китайца и оригинала: все та же, не прекращающаяся, круговая индикация.


Откуда вообще проблема? Зачастую, люди приобретают салазки для установки не оригинальных дисков в сервер, например SSD, либо просто большего объема. Что характерно, контроллер проверяет только салазку, а не диск.

Бывает так, что оригинальные салазки уже использовались для установки неродного диска и, в результате, накапливается большое количество HP'шных винтов без салазок, которые однажды приходится использовать, для чего покупаются дешевые и, вроде бы, ничем не отличающиеся от оригинала, китайские реплики.

Как опознать китайскую "реплику"? Сейчас покажу.

Вот в такой коробочке она обычно поставляется.


Далее, на всех фото сверху реплика, снизу оригинал.

1. Хорошо видно, что отличается цвет пластика. Оригинал посветлее будет.


Наличие или отсутствие наклейки с указанием модели диска может быть дополнительным признаком, но не гарантией. На реплике с высокой вероятностью никакой наклейки не будет.

2. Маркировки на левой боковине. У оригинала, помимо партномера, выбит логотип hp.


3. Отличается и контактная плата. У китайца желтая, у оригинала оранжевая, почти коричневая. Плюс, у оригинала есть маркировка.


4. Изнутри на той же левой части оригинала выбит партномер:


5. Отличается цвет метала правой стороны, у китайца более насыщенный:


Мораль сей басни такова: не все салазки одинаково полезны. Плюс ко всему этому веселью реплики, зачастую, довольно туго заходят на посадочные места. До такой степени, что потом вынуть диск без повреждения салазки просто невозможно.

Hewlett Packard Enterprise

Статья-исследование. Докопаемся до источника проблемы и исправим её.

Как обычно ночью сработал мониторинг. Хорошо, что он сработал, даже отлично. Плохо что ночью.

На сервере HP Proliant DL360 Gen9 произошёл сбой. iLO выплюнуло ошибку, zabbix сервер поймал событие, сработал триггер аппаратной проблемы. По триггеру отправилось письмо, SMS и сработал скрипт, который отправил на Asterisk call-файл. И наша телефония дозвонилась до меня, ночью, зараза. Я не разобрал что там промямлил в трубку робот, но главная задача по поднятию админа была выполнена, как говорится, смотрите подробности в SMS.

Отказал кэш RAID контроллера Smart Array P440ar:

Cache Module Status — Degraded

hpe

На первый взгляд проблема не критичная, может ждать до утра. А утром начались проблемы, — сильная деградация по дискам. Больше суток ушло на то, чтобы переместить виртуальные машины с данного гипервизора на другой сервер. Я не замерял, но скорость переноса данных увеличилась раз в пять. Некоторые сервисы пришлось остановить.

Оказалось, что кэш RAID контроллера заметно оптимизирует работу массивов.

Поиск проблемы

Сервер уже не на гарантии, справляться с проблемой придётся самому.

Есть несколько возможных точек отказа:

  1. Проблема программная, возможно, из-за недавней прошивки RAID контроллера. Может помочь перезагрузка, сброс настроек RAID контроллера, выключение-включение кэша.
  2. Проблема с RAID контроллером. Может помочь прошивка или замена.
  3. Проблема с модулем кэша. Поможет разборка-сборка, замена модуля кэша.
  4. Проблема с проводами или контактами. Поможет разборка-сборка, переподключение батарейки, замена батарейки.
  5. Проблема с батарейкой. Поможет замена батарейки.

Первым делом перезагрузил сервер и iLO. Не помогло.

Проверил статус батарейки. Статус OK.

hpe

Непонятно, загрузимся в HPSSA (HP Smart Storage Administrator). Перезагружаем сервер, при загрузке нажимаем F9 для входа в System Utilities.

hpe

Выбираем System Configuration.

hpe

Выбираем проблемный контроллер: Embedded RAID 1: Smart Array P440ar Controller.

hpe

Выбираем Exit and launch HP Smart Storage Administrator (HPSSA).

hpe

Выбираем (уже выбрано) Smart Storage Administrator. Сюда же можно попасть выбрав F10 (Intelligent Provisioning) при загрузке, но нужно будет успеть переключить пункт в этом окне.

hpe

Дожидаемся загрузки Smart Storage Administrator.

hpe

Видно, что на RAID контроллере Smart Array P440ar светится предупреждение.

hpe

Текст ошибки здесь более информативный:

Smart Array P440ar in Embedded Slot has one or more cache module batteries/capacitors that are recharging. Caching operations such Expansion, Extension, and Migration are temporarily suspended until the batteries/capacitors are fully charged. Caching operations will automatically resume when charging is complete.

Получается, батарейка находится в процессе зарядки. Такое случается, если воткнуть разряженную батарейку. Ошибка пропадёт после полной зарядки. Но в моём случае батарейка уже давно установлена, ошибка сама не пропадает.

hpe

Server → Actions → Diagnose.

hpe

View Diagnostic Report.

hpe

Начинается сбор диагностических данных.

hpe

Кэш RAID контроллера отключён, других ошибок нет. Полистал отчёт, ничего особенного не обнаружил.

Посмотрим на кэш. Tools → Cache Manager → Controller Cache → Controller Cache Details.

hpe

  • Cache Status: Enabled, but not currently active.
  • Cache Status Details: Cache disabled; power source charging is low.
  • Battery/Capacitor Status: Recharging

Кэш отключён, т.к. батарейка заряжается, а уровень её заряда низок. Можно посмотреть больше деталей: View more details.

hpe

Более подробная информация нам особо не помогает, единственное, что интересно в нашем случае, это запись:

  • Enable Write Cache When Battery/Capacitor Not Present or Not Completely Charged: Disabled

В кэше контроллера есть опция, позволяющая включить кэш при отсутствии батарейки или при низком её заряде. Если бы сервер был боевым, если бы нам срочно нужно было наладить работу сервера, то включение этой опции нам бы очень помогло. Вот только включить эту опцию мы не можем, так, как кэш в настоящий момент отключён: There are no available actions. Печаль, но есть обходной манёвр.

Временное решение проблемы

Помимо кэша контроллера у каждого физического диска есть собственный кэш, который по умолчанию в RAID массивах отключён. Включим.

hpe

Smart Array P440ar → Actions → Configure → Modify Controller Settings.

hpe

Меняем галку Physical Drive Write Cache State на Enabled. Save Settings.

hpe

Controller Settings were successfully saved. Настройки сохранены. Как вы думаете, что сейчас произойдёт? Правильно, кэш RAID контроллера отключится. и все его предупреждения сбросятся.

Посмотрим на кэш. Tools → Cache Manager → Controller Cache → Controller Cache Details.

hpe

  • Cache Status: OK
  • Battery/Capacitor Status: OK

Даже батарейка перестала заряжаться. Но главное не это, появилась кнопка Modify Caching Settings, нажимаем.

hpe

Нас предупреждают, что включение кэша с плохой батарейкой приведёт к потере данных при внезапном отключении питания. Но всё же мы теперь можем, если очень захотим, включить опцию "Enable Write Cache When Battery/Capacitor Not Present or Not Completely Charged". Я не буду включать, срочного у меня ничего нет. Если сейчас снова отключить кэш физических дисков, то ошибка не вернётся до следующего цикла проверки батареи.

Становится понятно, что проблема в самой батарейке или в её проводах. Убедимся в этом. Перезагружаем сервер, жмём F9, во встроенных приложениях загружаем диагностический режим. Выполняем экспресс-проверку системы.

hpe

При проверке батарей: Основная — Заменить.

Решение проблемы

Меняем батарейку в сервере:

После замены батарейки снова загружаем диагностический режим и выполняем экспресс-проверку системы.

Начало второго квартала 2019 года ознаменовалось обновлением серверного портфеля Hewlett Packard Enterprise. При этом это обновление возвращает к нам «потерянного младшего брата» — серию серверов HPE ProLiant DL100.


HPE ProLiant DL180 Gen10

«Сотая» серия давно известна многим как бюджетное решение для архитектур, не предполагающих взрывного роста и масштабирования. Обладая сравнительно невысокой стоимостью, серверы 100-й серии хорошо вписывались в архитектуры с ограниченным бюджетом. Но после 7-го поколения компания HPE решила пересмотреть свой серверный портфель решений для оптимизации издержек на производстве. Результатом стало исчезновение 100-й серии и, как следствие, сложности в проектировании бюджетных архитектур на решениях HPE. До текущего момента на рынке имелась только 300-я серия, обладающая выдающейся производительностью и гибкостью в конфигурировании, но не столь терпимая к бюджетным ограничениям.

В связи с жесткой конкурентной борьбой компания HPE принимает решение вернуть 100-ю серию в свой портфель. Начиная с текущего поколения (Gen10), «сотки» возвращаются на российский рынок. С начала апреля доступны к заказу HPE ProLiant DL180 Gen10, а летом появится и ProLiant DL160 Gen10. Так как сотая серия изначально позиционируется как более простая и бюджетная версия трёхсотой, то любой обзор неизбежно приведет к их сравнению.

Обе модели являются двухпроцессорными, двухюнитными (2U 2P) универсальными серверами, подходящими для практически любых сценариев использования. Это единственная общая черта «братьев».

Как уже было отмечено, «сотки» отличаются ограничением количества поддерживаемых опций и, в целом, гибкостью конфигурирования системы. Серверы DL180 (как и DL160 в будущем) будут доступны только как BTO — Built to Order.

Это означает заранее подготовленный набор артикулов, за которыми закреплены конкретные модели CPU и RAM. Если говорить точнее, то на текущий момент вариаций всего 2: однопроцессорные конфигурации на базе CPU Intel Xeon-Bronze 3106 и Xeon-Silver 4110, обе с предустановленной памятью 16Gb PC4-2666V-R RAM и корзиной для 8ми SFF дисков. Количество слотов под оперативную память уменьшено до 16 в сравнении с 24 слотами у DL380. Из перечня поддерживаемых модулей памяти пропало все, кроме установленного в базовой конфигурации: HPE 16GB (1x16GB) Single Rank x4 DDR4-2666 CAS-19-19-19 Registered Smart Memory Kit. Опций с Dual Rank или Load Reduced DIMM на текущий момент не предусмотрено.

Если говорить о хранении данных, то сотая серия заметно проигрывает трёхсотой:

  • Одна дисковая корзина на 8 SFF
  • Встроенный контроллер S100i
  • Опциональные контроллеры E208i/E208e и P408i

В дальнейшем планируется добавить дополнительные опциональные корзины на 8 SFF (до 2-х на шасси) и новое шасси под LFF-накопители.

Для доступа в сеть шасси оборудовано двумя портами 1 GE, которые могут быть расширены до двух 10/25Gb портов с помощью опционального FlexibleLOM адаптера.

Количество слотов для PCI-E модулей не изменилось, доступны следующие варианты (при двухпроцессорной конфигурации):

  • 3+3 PCI-E x8 (использование FlexibleLOM требует наличие специального Riser-модуля)
  • 1 PCE-E x16 + 4 PCI-E x8

Из-за новизны вышедшей модели наблюдается некоторая неразбериха в документации. Так, согласно QuickSpecs, указаны только жесткие диски с SAS-интерфейсом (300/600/1200 Gb 10k). Но наличие встроенного рейд-контроллера Smart Array S100i, который поддерживает только SATА-накопители, наводит на мысли о неточности в документации.

Скорее всего, поддерживаются все Gen10 SATA-накопители от других моделей серверов, как это и было раньше. А при условии установки дискретного рейд-контроллера HPE Smart Array E208i, появится возможность использования SAS-накопителей.

По причине свежести релиза пока нет полного списка поддерживаемых опций, но можно предположить отсутствие NVMe-накопителей и графических ускорителей, так как мощность блоков питания имеет ограничение 500W.

Если ваши задачи требуют масштабируемость и производительность DL380 Gen10, но по финансовым показателям вы не могли себе этого позволить, то DL180 Gen10 создан специально для вас. Осталось только дождаться полного списка опций и LFF-шасси, которые появятся на российском рынке вместе с DL160 Gen10.

Номенклатура для заказа:

Артикул Наименование
879513-B21 Proliant DL180 Gen10 Bronze 3106 Rack(2U)/Xeon8C 1.7GHz(11MB)/1x16GbR1D_2666/S100i(ZM/RAID 0/1/10/5)/noHDD(8up)SFF/noDVD/iLOstd/4HPFans/2x1GbEth/EasyRK/1x500w(2up)
879514-B21 Proliant DL180 Gen10 Silver 4110 Rack(2U)/Xeon8C 2.1GHz(11MB)/1x16GbR1D_2666/S100i(ZM/RAID 0/1/10/5)/noHDD(8up)SFF/noDVD/iLOstd/4HPFans/2x1GbEth/EasyRK/1x500w(2up)

Более полную информацию о наличии и детальных характеристиках оборудования вы найдете на нашем b2b портале .

Читайте также: