Online data retrieval failures occurred windows 2012 ошибка

Обновлено: 05.07.2024

Ранее один из дисков вылетел, но на Spare контроллер почему-то его не поменял. мои админы проворонили это и. теперь массив вообще не поднимается. Посоветуйте что можно сделать. на массиве есть ряд важных данных.

Массив Raid 5 из 13 дисков SATA (по 500 Гб)

можете более конкретно описать, что сообщает контроллер, статусы дисков - физических и логических?
а так думаю вам к специалистам по восстановлению данных из рейда. если есть бэкап, то дешевле, быстрее и проще поднять данные из него. igornov писал(а): Ранее один из дисков вылетел, но на Spare контроллер почему-то его не поменял. мои админы проворонили это и. теперь массив вообще не поднимается. Посоветуйте что можно сделать. на массиве есть ряд важных данных. Если я првильно понял, то два диска вылетели с массива. Пробуйте по очереди эти диски вернуть в онлайн. По очереди. Если не получится, то только к дата-рекаверам. Но шансы на восстановление невелики. maverlife писал(а): Если я првильно понял, то два диска вылетели с массива. Пробуйте по очереди эти диски вернуть в онлайн. По очереди. Если не получится, то только к дата-рекаверам. Но шансы на восстановление невелики.

факта вылета 2-х дисков из массива не вижу. Один сгорел 3 месяца назад, на его место как оказалось всё-таки встал hotspare. Сейчас же этот hotspare стоит так как будто он и никогда не вставал вместо сбойного диска. Ну а все остальные диски в статусе OK. Хотя сам массив в статусе failed.

Вы пишете по одному вернуть в онлайн... но они все в статусе ОК + в утилитах к этому массиву нету никаких инструментов чтобы это сделать. можно только расширить массив, создать Spare или удалить массив.

maverlife писал(а): можете более конкретно описать, что сообщает контроллер, статусы дисков - физических и логических?
а так думаю вам к специалистам по восстановлению данных из рейда. если есть бэкап, то дешевле, быстрее и проще поднять данные из него.

вот сообщает контроллер:

298 SATA Array B with Spare - 1 Logical Drive(s) contains a failed physical drive. To correct this problem, check the data and power connections to the physical drives or replace the failed drive. For more information, generate a diagnostics report under the Diagnostics tab.

274 0 MB SATA Drive at Port 4C : Box 2 : Bay 1 is bad or missing.
To correct this problem, check the data and power connections to the physical drive.

For more information, generate a diagnostics report under the Diagnostics tab.
271 (Failed) Logical Drive 2 (5.5 TB, RAID 5) has failed and cannot be used. All data on this logical drive has been lost. Configuration changes to this logical drive are not allowed until this problem is corrected. Also, if your controller supports Expansion, Extension, or Migration, these operations will not be available for any logical drives in the array until the problem is corrected.

Replace any failed physical drives and re-enable the failed logical drive. For more information, generate a diagnostics report under the Diagnostics tab.

Статусы физических дисков - ОК

Логический диск в статусе Failed

Ошибка "Выполняется оценка качества подключения" при попытке зайти на терминальную ферму

И так, в одно прекрасное утро, начали поступать массовые жалобы от технической поддержки, что пользователи не могут подключиться к RDS ферме. Я сразу полез проверять наши терминалы. При попытке подключиться, люди видели вот такую картину. Долго висело подключение со статусом "Выполняется оценка качества подключения"

Выполняется оценка качества подключения

После чего попытка подключения прерывается и появляется ошибка из ряда:

Компьютер не может подключиться к удаленному компьютеру, так как посреднику подключений не удалось проверить параметры файла RDP. Обратитесь за помощью к администратору сети

Ошибка подключения RDP

Алгоритм диагностики и устранения ошибки

Первым делом я через команду ping проверил сетевую доступность своих серверов, с ними было все в порядке. Далее я открыл оснастку управления RDS фермой и посмотрел статусы всех серверов участвующих в ней. Я увидел много ошибок:

Я увидел у одних статус "data retrieval failures occurred", у других статус "Target computer not accessible, где-то был статус "Cannot get role and feature data"

data retrieval failures occurred

Попытавшись открыть настройки RDS фермы, я получил вот такую ошибку:

The server pool does not match the RD Connection Brokers that are in it. Errors: Cannot connect to any of the specified RD Connection Brokers servers. Ensure that at least one server is avaliable and that the Remote Desctop Management (rdms), RD Connection Broker (tssdis), or RemoteApp and Desctop Connection (tscpubrpc) service running

Ошибка подключения к RDS брокерам

Видя все это безобразие, я полез на свои брокеры подключений, напоминаю для этого нужно использовать ключ "/admin". Начав изучать логи Windows я обнаружил событие ID 2048.

ID 2048: The Remote Desktop Connection Broker server detected that the database is not available and will notify all Remote Desktop Connection Broker plug-ins

The Remote Desktop Connection Broker server detected that the database is not available and will notify all Remote Desktop Connection Broker plug-ins

Тут все встало на свои места, пользователи видели ошибку "Выполняется оценка качества подключения" из-за того, что брокеры потеряли связь со своей базой данных. Напоминаю, что посмотреть настройки базы данных для отказоустойчивой RDS фермы, вам необходимо открыть окно "Выполнить" и ввести в нем:

Открытие cliconfg.exe

На вкладке "Alias" вы найдете имя сервера и параметры подключения к базе данных. Далее остается их только восстановить и вернуть работу вашей RDS ферме.

Просмотр настроек базы данных Connection Brokers

Дополнительные причины ошибки "Выполняется оценка качества подключения"

  • Из самых распространенных проблем, это наличие на вашем сервере, куда вы подключаетесь наличие программного продукта КриптоПРО версии 3.9, проблема там была в неком ГОСТ SSL, который предлагалось отключить или же полностью удалить КриптоПРО, с переходом на более свежую версию. Если нужно отключить ГОСТ SSL, то в реестре Windows нужно привести ключ cpksp вот к такому виду:

[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Control\Session Manager\CProPatches\SCHANNEL]
"Image Dll"="_schannel.dll"
[HKEY_LOCAL_MACHINE\SYSTEM\CurrentControlSet\Services\cpksp]
"Start"=dword:00000003

  • Вторая проблема, это не работает или не отвечает ваш сервер лицензирования удаленных рабочих столов. В диспетчере сервера — ошибки службы лицензирования рабочих столов. Отсутствует сервер лицензирования. Устраняем проблему с лицензиями и радуемся
  • Еще бывает, что помогает выбор транспортных протоколов, давайте подробнее. При подключении по RDP используются два транспортных протокола TCP/UDP. Фишка в том, чтобы оставить только TCP. Для этого создайте групповую политику или отредактируйте локальную на серверах подключений, вот по такому пути:
Конфигурация компьютера - Административные шаблоны - Компоненты Windows - Службы удаленных рабочих столов - Узел сеансов удаленных рабочих столов - Подключения - Выбор транспортных протоколов - выбрать только TCP

Потребуется перезагрузка или перезапуск служб RDP.

Выбор транспортных протоколов RDP

Этот параметр политики позволяет указать, какие протоколы можно использовать для доступа к данному серверу по протоколу RDP. Если вы включаете этот параметр политики, необходимо указать, хотите ли вы, чтобы протокол RDP использовал протокол UDP.

Вы можете выбрать один из следующих вариантов: «Использовать UDP и TCP (по умолчанию)», «Использовать только TCP» или «Использовать либо UDP, либо TCP». Если вы выбираете вариант «Использовать либо UDP, либо TCP» и подключение UDP выполнено успешно, то большая часть трафика по протоколу RDP использует протокол UDP.

Если подключение UDP не выполнено успешно или если вы выбираете вариант «Использовать только TCP», весь трафик по протоколу RDP использует протокол TCP.Если вы отключаете или не настраиваете этот параметр политики, RDP выбирает оптимальные протоколы для обеспечения наилучшего взаимодействия с пользователем.

Я часто встречал ситуацию, что человек работает удаленно с дачи или еще более удаленного места, со своим мобильным интернетом, в следствии проблем со скоростью получал ошибку "Выполняется оценка качества подключения", где сразу начинал говорить, что ваша RDS ферма плохая. Пока ты ему докажешь, что дело в его мобильном интернете, пройдет не один десяток минут. Хорошо, что после RDP клиента восьмой версии, диагностировать стало проще, там появился индикатор, о подключении к клиенту удаленного рабочего стола (RDC).

Вы найдете индикатор RDC вверху панели подключения, в верхней части любого полноэкранного подключения к удаленному рабочему столу. Индикатор отобразит от одной до четырех полос, которые суммируют задержку двустороннего соединения (RTT) и текущую полосу пропускания в простой для чтения иконке. Выглядит, это вот так.

Качество подключения к удаленному компьютеру хорошее

RDC индикатор

Например, полный набор из четырех полос указывает, что задержка составляет менее 50 мс, а полоса пропускания превышает 10 Мбит/с. Когда полосок меньше, пользователь подключается с более высокой задержкой или с меньшей пропускной способностью.

Пользователь также может щелкнуть значок индикатора, чтобы увидеть письменное описание качества своего соединения и узнать, пользуется ли он дополнительными преимуществами соединения на основе UDP.

We are currently experiencing the following error under the Server Manager > Manageability on Two of our Windows Server 2012 R2 Servers. Online- Data retrieval failures occurred.

I can't find any information in the event viewer that relates to this error. Does anyone have any suggestions?

TPark IT Technician

Ответы

This error most time occur when the firewall configure incorrect, please try to disabled firewall on all this servers, then try again. This indicated the Server Manager cannot get event data from the target server. The user might not have access rights to the target server event log, or event log files might not contain valid data.

For some roles and features (Hyper-V, Print and Document Services, AD LDS), this error can occur after installation, but before required post-installation configuration has been completed. The error is resolved after post-installation configuration is complete.

This error can also occur if specific roles and features have been installed, but not yet configured. The following underlying error messages are examples of known cases where a role, role service, or feature requires post-installation configuration to clear the error.

•Events from ‘Virtualization.Events.xml’ could not be enumerated. (This error is cleared after required post-installation configuration for Hyper-V is completed.)

•Events from ‘PrintServices.Events.xml’ could not be enumerated. (This error is cleared after required post-installation configuration for Print and Document Services is completed.)

•Events from ‘ADAM.Events.xml’ could not be enumerated. (This error might be cleared after required post-installation configuration for Active Directory Lightweight Directory Services is completed.)

Configure Remote Management in Server Manager

Windows Server 2012 - Server Manager Troubleshooting Guide, Part II: Troubleshoot Manageability Status Errors in Server Manager

The Windows Azure™ Marketplace is an online market for buying, and selling finished Software as a Service (SaaS) applications and premium data.

O&O Software develops award-winning windows software for PC-optimization, data imaging, backup, secure data deletion, data recovery and administration.

defragment , fragmentation , windows performance, erase data, recovery

Google PageRank: 0 из 10 Яндекс ТИЦ: 190

O&O Software develops award-winning windows software for PC-optimization, data imaging, backup, secure data deletion, data recovery and administration.

defragment , fragmentation , windows performance, erase data, recovery

Google PageRank: 0 из 10 Яндекс ТИЦ: 190

O&O Software develops award-winning windows software for PC-optimization, data imaging, backup, secure data deletion, data recovery and administration.

defragment , fragmentation , windows performance, erase data, recovery

Google PageRank: 0 из 10 Яндекс ТИЦ: 190

mnoGoSearch - Internet Search Engine Software storing data in SQL Databases

shareware , freeware , download , internet , unix

Блог одной виртуальной сети. Создание виртуальных машин и сетей. Установка и настройка VMWare, windows server 2012, active directory, dhcp, nat, iis, terminal server.

windows , настройка , программа , xp , windows xp

Norton offers the best solution for online backup, remote data backup, and offsite data protection. Automatically back up photos and files on multiple Windows and Mac computers with Norton Online Backup.

Пошаговые руководства по настройке Ubuntu 14.04 / 12.04 / Ubuntu 10.10, Windows Server 2008/R2, 2012, Server 2003, заметки о работе,конфигурирования, разбор

Hetzner Online als ein führender Webhostinganbieter und erfahrener Rechenzentrumsbetreiber in Deutschland bietet professionelle Hostinglösungen zu fairen Preisen: Webspace, leistungsstarke Root und Managed Server, Domainregistrierung und SSL-Zertifikate.

hetzner , hetzner online, webhostingprovider , webhosting , provider

Hetzner Online als ein führender Webhostinganbieter und erfahrener Rechenzentrumsbetreiber in Deutschland bietet professionelle Hostinglösungen zu fairen Preisen: Webspace, leistungsstarke Root und Managed Server, Domainregistrierung und SSL-Zertifikate.

hetzner , hetzner online, webhostingprovider , webhosting , provider

Авторизация через доменные учетные записи не проходила,вываливалось окно с вводом логина и пароля.

Hetzner Online offers professional hosting solutions at fair prices. Our offers range from classic web space to high-performance dedicated root and managed servers as well as services such as domain registration or SSL certificates.

Google PageRank: 0 из 10 Яндекс ТИЦ: 0

Динамика популярности - Windows server 2012 r2 online - data retrieval failures occurred

Google Тренды это диаграмма для отслеживания сезонности ключевых слов. Этот график позволяет лучше понять сезонное изменение полулярности запросов по определенной тематике.

Значения приведены относительно максимума, который принят за 100. Чтобы увидеть более подробную информацию о количестве запросов в определенный момент времени, наведите указатель на график.

cluster-ownership

И дело не в iSCSI. Диски подключены по Fibre Channel.

Нередко встречаю в своей деятельности, что люди, формируя кластер, предпочитают собрать два интерфейса в team, обеспечивая отказоустойчивость на физическом уровне. Само по себе это неплохо (хотя в случае каких-то проблем на сетевом уровне мы довольно часто просим его разобрать), но нередко случается, что физических интерфейсов на сервере всего два, и объединив их мы получаем один.

Последовательность событий, озадачивающая администратора кластера выглядела так:

Warning 140 Microsoft-Windows-Ntfs N/A
The system failed to flush data to the transaction log. Corruption may occur in VolumeId: D:, DeviceName: \Device\HarddiskVolume5. (A device which does not exist was specified.)

Warning 140 Microsoft-Windows-Ntfs N/A
The system failed to flush data to the transaction log. Corruption may occur in VolumeId: D:, DeviceName: \Device\HarddiskVolume5. (A device which does not exist was specified.)

Warning 140 Microsoft-Windows-Ntfs N/A
The system failed to flush data to the transaction log. Corruption may occur in VolumeId: D:, DeviceName: \Device\HarddiskVolume5. (An operation was attempted to a volume after it was dismounted.)

Error 1038 Microsoft-Windows-FailoverClustering Physical Disk
Resource Ownership of cluster disk ‘ClusterDisk_01’ has been unexpectedly lost by this node. Run the Validate a Configuration wizard to check your storage configuration.

Error 1069 Microsoft-Windows-FailoverClustering Resource Control Manager
Cluster resource ‘ClusterDisk_01’ of type ‘Physical Disk’ in clustered role ‘SQL Server (ClusterNode01)’ failed. Based on the failure policies for the resource and role, the cluster service may try to bring the resource online on this node or move the group to another node of the cluster and then restart it. Check the resource and group state using Failover Cluster Manager or the Get-ClusterResource Windows PowerShell cmdlet.

По результатам изучения в cluster.log выяснилось, что проблемам с дисками предшествовали следующие события:

Нода 2 (IP 10.10.12.19) потеряла связь с нодами 1 и 3 (10.10.12.18, 10.10.12.20)

unreachable from 10.10.12.19:

unreachable from 10.10.12.19:

Вскоре после этого проверка показала, что диск, которым эта нода вроде как владеет, уже кем-то используется.

>net helpmsg 170

The requested resource is in use.

Ну и ожидаемый результат:

Описанным выше событиям предшествовало большое количество записей о проблемах доступности нод друг до друга в течение нескольких часов (более четырёх, возможно было и больше, но лог начался с момента за 4 часа до инцидента). Примерно так это выглядит:

has failed with status (10054)’

has failed with status (10054)’

Краткий итог по результатам диагностики и расследования:

  • имели место сетевые проблемы, ноды регулярно теряли друг друга;
  • т.к. у нас 3 ноды и 1 witness, даже с динамическим majority в условиях нестабильного сетевого соединения есть вероятность возникновения partitioning или split brain (node+node и node+withess);
  • в случае, если partition считает себя кластером, а второй partition недоступен, первый пытается взять на себя нагрузку и ресурсы, в т.ч. «захватить» диски;
  • активная нода обнаруживает, что диск используется другим сервером и теряет ownership.
  • Сервис падает.

А вот если бы каждая нода имела не один сетевой интерфейс, а три, как положено: межкластерное взаимодействие, менеджмент и клиентский доступ, то с большой долей вероятности такого бы не случилось. Потому что пока сосед доступен хотя бы по одному каналу (а хартбиты ходят по всем трём), он считается живым.

Читайте также: