Произошла устранимая аппаратная ошибка компонент память

Обновлено: 07.07.2024

Не могу локализовать ошибку, проявляется по разному, но итог один - тормоза на терминальном сервере. Извиняюсь за многобукв.

Имеем сервер :
Мать - ASRock EP2C612D8 (был ранее заменена по гарантии на идентичную, после замены ОС не переустанавливали)
ОЗУ - 64 Гб
Процессор - Intel Xeon E5-2620 v3, 2,4 Ггц
RAID контроллер - LSI MegaRAID SAS 9271-8i

На сервере крутится
Windows Server 2008R2
Терминалы
MS SQL 2012
Сервер 1С
УТ 10.3

80 Гб
Пользователей до 20-25, в основном работают в УТ, забивают заявки и и тд.

В штатном режиме работы процессор загружен до 15 процентов, чаще всего до 10.

Сегодня пользователи пожаловались на тормоза, в диспетчере задач увидел загруженность процессора под 60%, причем понять что именно грузило не возможно, поочередно процессор то SQL, то платформа, то rphost, то другое по, хотя показатели по оперативной памяти и дисковой активности были в норме.
В событиях красовалась ошибка :

Неустранимая аппаратная ошибка.
Источник : WHEA-Logger
Компонент: Порт PCI Express Root
Источник ошибки: BOOT
Шина:Устройство:Функция: 0x0:0x3:0x2
ИД поставщика:ИД устройства: 0x8086:0x2f0a
Код класса: 0x604

Согласно ИД устройства это
Intel(R) Xeon(R) E7 v3/Xeon(R) E5 v3/Core i7 PCI Express Root Port 3 - 2F0A

Подобная ошибка и тормоза выскакивали не первый раз, помогало обычная перезагрузка.

Пробовал обновить драйвера на материнской плате - безуспешно, до следующих тормозов могло пройти 2-3 недели.
Сегодня перезагрузка не решила, процессор был загружен изначально, помогло только вкл/выкл.

После загрузки снова выскочила ошибка, но уже ссылалось на другое ИД оборудования
Intel(R) Xeon(R) E7 v3/Xeon(R) E5 v3/Core i7 DMI2 - 2F00

С подобным дел не имел, теряюсь в догадках.

Провернуть глобальные вещи нет возможности, так как на сервер свободен только 6 часов. Банально даже систему переставить не успею толком.
Завтра буду ставить вопрос перед руководителем о приобретении мощного ПК, на который можно все это будет временно перенести. (i7,SSD все дела).

Железо не под задачи да и само по себе не очень надежное.

У тебя идет банальный "перегрев" мамки при работе/нагрузке и это еще осложнено старой осью с не совсем правильными драйверами.

Обновление биоса/оси/дров может помочь но совершенно не факт.

Ищите другой сервак и выносите на него одну из баз чтобы снизить нагрузку, заодно и резерв будет.

БП3 дико прожорлива в терминале, если рабочие компы позволяют то в тонкие клиенты ее. (2) "БП3 дико прожорлива в терминале" // Речь о толстом клиенте в терминале?

(3) > Речь о толстом клиенте в терминале?

У автора УТ-шка 10.3. А она разве в тонком клиенте, а не в толстом на обычных формах?

Вообще идея смешивания сервера терминалов с СУБД и сервером приложения на одном компе не самая лучшая.
По возможности надо сервер терминалов отдельно выносить, оставив только СУБД+1С. Для 25 пользователей самое то.
Начать можно с того, что пользователей с нормальными по характеристикам клиентскими компами вообще выкинуть с терминального сервера.

(0) У вас этот сервер стоит в отдельном, хорошо охлаждаемом помещении? Если нет, то можно попросить руководство обеспечить серверу необходимые условия эксплуатации. И туда же потом поставить еще I7 с SSD и всеми делами.

(0) Обновляй биосы мамки и рейд контроллера.

PS это еще одна отрицательная сторона серверного оборудования - необкатанность прошивок и драйверов.

(2) В БУХ работает 1-2 человека, как правило это переброс документов из УТ и перепроверенные их в отчетные периоды.
В УТ 10.3 днем работает пару бухгалтеров, разносят приходники и c 12 до 21 остальные пользователи забивают до 1000 РТУ.
В штатном режиме таких проблем не было, процессор загружается от 0 до 10 процентов и не более. Время отклика и длина очереди дисковой системы в норме. Я понимаю что сервер не хватает с небес звезды, но с нагрузкой справлялся.

А тут даже после перезагрузки тормозил сервер целиком, даже банальное сворачивание окна проводника происходило не спеша и небрежно.

(6)
1. Виртуальных серверов нет.
2. Температура процессоров и материнской была в норме, температура в серверной не превышала 25 градусов, сегодня включил принудительное охлаждение.
3. Длина очереди к дискам и время отклика на удивление были в норме. Отклик порядка 10 мс.
4. Изучу вопрос.

(7) Тоже склонен глобально заняться этим вопросом, но смогу только после переноса текущего ПО на другую площадку. Выделят ли для этого хоть какие-то средства - большая загадка. Планировал приобрести i7 c максимальной частотой на ядро, оперативы 32/64 и воткнуть пару SSD от самсунг. Как раз будет некий резерв, куда можно будет переносить базы, так и машина на которой можно будет шустрее поорбрезать базы.

(4) Основная часть клиентов УТ 10.3 работают через аппаратные тонкие клиенты, грузятся по сети (WTware).
Напрямую по RDP с компьютеров подключается 3 бухгалтера да и компьютеры у них так себе (4Гб ОЗУ и прочее), не думаю что они что-то решат.

Отделить терминалы от 1С+SQL это хорошо, но увы не располагаю такими ресурсами, просто тупо некуда. Особенность предприятия - минимальные затраты на АйТи, а лучше чтоб их вообще не было. Сложно что-то объяснить человеку, если он не слушает, ну это так . эмоции.

Склонен все же выбить производительный системник (писал выше), обновить биос, прошивку контролера обновить, сделать ТО серверу, переустановить ОС и там будет понятно, решаемая эта проблема или нет.

(10) "Особенность предприятия - минимальные затраты на АйТи, а лучше чтоб их вообще не было. Сложно что-то объяснить человеку, если он не слушает" // Так ты пади объяснять не умеешь, лезешь с какой-нибудь технической хней.
Ты в понятиях управленца попробуй разъяснить, что если не вкладывать в ИТ, то будет то-то и то-то (столько-то часов / дней простоя, например)

(11) Это скажем так "особенность" руководителя. Он считает что ИТ вообще лишнее и с ним он мирится как с необходимым злом, что-то вкладывать это как переступить через себя.

Чтоб понимать насколько неохотно выделяются средства - приведу пример. Ежемесячно предприятие тратит

15 т.р. на заправки картриджей и мелкий ремонт техники(блоки питания, батареи ИБП, мышки и прочая мелочевка). Даже при таких минимальных тратах я оказался под подозрением. Получил звание - Директор по расходам. В итоге провел анализ своих затрат за 3 года и подготовил докладную записку, в которой на цифрах, что за 3 года цена на заправку не изменились и остались на прежнем уровне. Вроде как этот вопрос закрыл.

В мае взял отпуск на 1 рабочую неделю и как по закону подлости произошел вот такой же баг как я и описывал в (0). Был в горах, вне зоны GSM.
Два дня водили админов со всего города и на второй день решились перезагрузить сервер и все вернулось на круги своя. Что было потом, сложно описать приличными словами. В итоге шеф признал, что резерв нужен, что бы не было простоев, но платить полную стоимость аналогичного сервера он не готов. Мол ищите иной хитрый способ.
Ничего иного кроме мощного ПК на SSD дисках я не придумал.

(9) >А тут даже после перезагрузки тормозил сервер целиком, даже банальное сворачивание окна проводника происходило не спеша и небрежно.

После обновления до версии 1709 (32-бит), проводник перестал открываться, после загрузки системы, как из панели задач, так и из меню "Пуск".
Единственный способ, у меня на рабочем столе, был ярлык для папки, на локальном диске, если запустить его, то, тогда Проводник запускается и уже в следующие разы можно его открывать как из панели задач, так и из меню "Пуск".
Когда его открываю не через этот ярлык, появляется окно Проводника, которое висит около минуты с надписью: "Выполняется. " После этого он крашится и в трее перезагружаются иконки, половина которых исчезает.

В журнале такая ошибка:

Имя сбойного приложения: Explorer.EXE, версия: 10.0.16299.15, метка времени: 0x85498037
Имя сбойного модуля: AcSpecfc.DLL, версия: 10.0.16299.64, метка времени: 0x118a490a
Код исключения: 0xc00000fd
Смещение ошибки: 0x0001ff5a
Идентификатор сбойного процесса: 0x13ac
Время запуска сбойного приложения: 0x01d36c5125f780e0
Путь сбойного приложения: C:\WINDOWS\Explorer.EXE
Путь сбойного модуля: C:\WINDOWS\SYSTEM32\AcSpecfc.DLL
Идентификатор отчета: 078b8b7e-9aa5-4bfd-9b6d-93ae96adaf96
Полное имя сбойного пакета:
Код приложения, связанного со сбойным пакетом:

Перелопатил всю сеть, но так ничего и не нашёл.

После обновления до версии 1709 (32-бит), проводник перестал открываться, после загрузки системы, как из панели задач, так и из меню "Пуск".
Единственный способ, у меня на рабочем столе, был ярлык для папки, на локальном диске, если запустить его, то, тогда Проводник запускается и уже в следующие разы можно его открывать как из панели задач, так и из меню "Пуск".
Когда его открываю не через этот ярлык, появляется окно Проводника, которое висит около минуты с надписью: "Выполняется. " После этого он крашится и в трее перезагружаются иконки, половина которых исчезает.

В журнале такая ошибка:

Имя сбойного приложения: Explorer.EXE, версия: 10.0.16299.15, метка времени: 0x85498037
Имя сбойного модуля: AcSpecfc.DLL, версия: 10.0.16299.64, метка времени: 0x118a490a
Код исключения: 0xc00000fd
Смещение ошибки: 0x0001ff5a
Идентификатор сбойного процесса: 0x13ac
Время запуска сбойного приложения: 0x01d36c5125f780e0
Путь сбойного приложения: C:\WINDOWS\Explorer.EXE
Путь сбойного модуля: C:\WINDOWS\SYSTEM32\AcSpecfc.DLL
Идентификатор отчета: 078b8b7e-9aa5-4bfd-9b6d-93ae96adaf96
Полное имя сбойного пакета:
Код приложения, связанного со сбойным пакетом:

Перелопатил всю сеть, но так ничего и не нашёл.

Была схожая проблема с калькулятором не грузился и всё. Решение было следующим:
Службу контроля учетных записей UAC сначала ставим на максимальный уровень, после этого запускаю калькулятор он грузится как положено, затем возвращаю уровень контроля учетных записей в прежнее состояние. Калькулятор работает с тех пор нормально. Возможно это поможет.

Ну и второй вариант: скачать образ win10 1709 с офф.сайта, и установить систему по новой, а не обновляться до этой версии. Часто возникают проблемы с системой именно после обновления до какой-либо версии.

Авторизуясь в LiveJournal с помощью стороннего сервиса вы принимаете условия Пользовательского соглашения LiveJournal

Добрый день, господа. Второй день мучаюсь проблемой:
имеется сервер с материнкой gigabyte GA-6PXSV3 (биос версии r8) в нее воткнуты 4 планки памяти IBM 43W9453 по 8 гиг. на сервере: 2008r2 + MSSQL с ббазой в 5 гиг и вебсервисом локальным, акронис 11.5

Когда все 4 планки установлены, при выполнении малейшей задачи (копирование файлов, запуск приложения и т.д.) начинает сыпаться ошибка памяти:

Event ID: 47 WHEA-Logger

The details view of this entry contains further information.
[ Name] Microsoft-Windows-WHEA-Logger
[ Guid]
ErrorSource 1
FRUId
FRUText
ValidBits 0x0
ErrorStatus 0x0
PhysicalAddress 0x0
PhysicalAddressMask 0x0
Node 0x0
Card 0x0
Module 0x0
Bank 0x0
Device 0x0
Row 0x0
Column 0x0
BitPosition 0x0
RequesterId 0x0
ResponderId 0x0
TargetId 0x0
ErrorType 0
Length 873
RawData 435045521002FFFFFFFF03000200000002000000 6903000019300F000F0C0E140000000000000000 0000000000000000000000000000000000000000 00000000BDC407CF89B7184EB3C41F732CB57131 B18BCE2DD7BD0E45B9AD9CF4EBD4F890AAACCC87 7E18D00100000000455200000000000000000000 0000000000000000580100004900000001020000 010000001411BCA5646FDE4EB8633E83ED7C83B1 0000000000000000000000000000000002000000 0000000000000000000000000000000000000000 A1010000C00000000102000000000000ADCC7698 B447DB4BB65E16F193C4F3DB0000000000000000 0000000000000000020000000000000000000000 0000000000000000000000006102000008010000 0102000000000000011D1E8AF94257459C33565E 5CC3F7E800000000000000000000000000000000 0200000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000570100 00000000000002000000000000E4060300000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000400000000000000000000 0000000000000000000000000000000000000000 0000000000000000000100000001000000F4C8FD 8F7E18D001040000000000000000000000000000 000000000007000000910001004000008C006684 020000000086D252402100000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 0000000000000000000000000000000000000000 00000000000000000000000000

Запись падает в лог сначала в виде предупреждения, потом в виде ошибки, потом, есесьна БСОД.
Когда убираешь 2 планки, (оставляешь 2 соответственно) -система работает на ура. данная ошибка проскакивает ОЧЕНь редко(но проскакивает) - от нагрузки не зависит.

Скьюлю использование памяти ограничено, установлены последние дрова на систему и все обновления, потребление памяти и загрузка процессора - в низовых пределах.
Пробовал разные настройки биоса, разные режимы работы памяти ( мирроринг, индепендед и т.д.), пробовал дефолтный биос, менял память местами, пробовал разщные слоты.
По советам из гоогления ставил настройки питания в хайперфоманс в системе и в биосе.
Мемтест86 и виндовый мемтест проходил для всей памяти сразу и по-отдельности - без ошибок.
БП поменян на новый и более мощный.
Память резинками терта, на дефекты осмотрена и слоты на материнке кисточками чищены и продуты.

Кто сталкивался с подобным? Это что? винда? железо? брак материнки, недостаточное питание памяти или несовместимость?

Постоянно зависает ферма, бывает сутки работает, а бывает сразу после включения! В логах винды вот такая ошибка:

Произошла устраненная аппаратная ошибка.

Сообщивший компонент: ядро процессора
Источник ошибки: Исправленная ошибка проверки компьютера
Тип ошибки: Ошибка иерархии кэша
ИД APIC процессора: 1

Проц fx-9370, мать asus m5a99x evo r 2.0! Риг из 3-х 1070 + 1-1060
Как решить проблему, Может кто сталкивался?

Dimon

Друг форума

Постоянно зависает ферма, бывает сутки работает, а бывает сразу после включения! В логах винды вот такая ошибка:

Произошла устраненная аппаратная ошибка.

Сообщивший компонент: ядро процессора
Источник ошибки: Исправленная ошибка проверки компьютера
Тип ошибки: Ошибка иерархии кэша
ИД APIC процессора: 1

Проц fx-9370, мать asus m5a99x evo r 2.0! Риг из 3-х 1070 + 1-1060
Как решить проблему, Может кто сталкивался?

Вывешиваю решение для тех, кто сталкивается с таким же багом в ОС:

1. в BIOS заходите на страницу усовершенствованных вариантов технологии энергосбережения процессора.

2. Отключаете функцию CPU EIST Function

3. Отключаете функцию CPU Internal Thermal Control

4. Отключаете функцию CPU Enhanced Halt (C1E)

5. Переходите на страницу управления питанием материнской платы

6. Отключаете все C-States

7. Перезагружаетесь с сохранением настроек.

После этого ошибки WHEA-Logger c кодом 19 (Устраненная аппаратная ошибка /
Ошибка иерархии кэша) перестают появляться в системе. Нелишним будет сказать, что конечно же, данная инструкция подразумевает, что никакого разгона в системе нет.

Вдруг ни с того, ни с сего, посыпались в системный журнал основного КД ошибки, да не просто ошибки а с источником "WHEA-Logger", да с

событием номер 47.

Всё бы ничего, но описание ошибки напрягающее:

Произошла устранимая аппаратная ошибка.
Компонент: память
Источник ошибки: Исправленная ошибка проверки компьютера

Так как описание говорит. мало, что говорит, то пришлось брать помощь гугла. Как ни странно, но проблема не редкая.

WHEA

Что такое неисправимая ошибка WHEA

  • Поврежденное оборудование (процессор CPU, память, видеокарта, носитель информации, блок питания и т.д.)
  • Проблемы совместимости драйверов
  • Проблемы с нагревом и напряжением (разгон и изменение напряжения)
  • Поврежденные системные файлы Windows или файлы реестра

Наиболее частой проблемой является разгон и изменение напряжения. Если вы можете читать файлы дампов, воспользуйтесь программой BlueScreenView и пройдите по пути C: /Windows/Minidump и по временной метке выберете нужный дамп.

Запустите CHKDSK

Сброс разгона системы

Обновите BIOS / UEFI

Важной частью правильной работы компьютера является микропрограмма для материнской платы BIOS. Проверьте обновление на сайте производителя и установите обновления, если они доступны. Либо переустановите последнюю версию, чтобы убедиться, что программных ошибок в работе материнской платы нет.

Не знаете, какая у вас материнская плата? Скачайте и запустите CPU-Z. Откройте вкладку Mainboard и найдите производителя и модель материнской платы. Там же обозначена и версия BIOS. Будьте внимательны при прошивке, закройте все программы, для ноутбуков подключите питание и обязательно дождитесь окончания процесса.

Проверьте свои драйверы

Нажмите клавишу Windows + I, чтобы открыть панель «Параметры», затем выберите «Обновление и безопасность»> «Просмотреть историю обновлений». Можно удалить последние обновления оборудования или откатить драйвер через «Диспетчер устройств». Зайдите в свойства и нажмите откатить, дождитесь завершения процедуры.

Проверьте оперативную память

Или признанной программой memtest86. Для этого понадобиться USB флешка. Инсталлятор на нее находится внутри архива. Запускаете его, устанавливаете на флешку программу и загружайтесь с нее. Прогоните тесты минимум два раза, что убедится в исправности.

Сброс Windows 10 (в крайнем случае)

Если ничего из вышеперечисленного не помогает, вероятно причина в операционной системе. Есть два варианта исправления. Попробовать восстановление образа системы онлайн. Для этого запустите командную строку CMD или PowerShell от имени администратора и введите:

Дождитесь завершения процесса и перезагрузите компьютер. Эта команда скачивает образ системы и переустанавливает его поверх существующей. Нет результатов и ошибка WHEA все еще мучает, сделайте сброс системы. Перейдите в «Настройки»> «Обновление и безопасность»> «Восстановление», затем в разделе «Сбросить этот ПК» выберите «Начать». Система перезагрузится, затем вы можете выбрать Сохранить мои файлы или Удалить все.

Читайте также: