- Вопрос или проблема
- Ответ или решение
- Возможные проблемы с iDRAC: "Нераспознанный код POST", громкие вентиляторы и мигающая кнопка
- 1. Предварительная диагностика
- 2. Обновление прошивки
- 3. Проверка конфигураций BIOS/UEFI
- 4. Аппаратные сбои
- 5. Диагностика на уровне сервера
- 6. Замена аппаратных компонентов
- Заключение
Вопрос или проблема
У меня есть сервер Dell PowerEdge R530, которым я пользуюсь как минимум несколько лет. Внезапно, несколько дней назад, вентиляторы стали очень громкими, как будто сервер перезагружался, а затем через некоторое время становились тише. Все работало нормально, перезагрузок не произошло, и нагрузка не была выше или пиковее обычного.
Я обнаружил, что синий свет сзади, который обычно горит постоянно, начал мигать, а маленькая кнопка с наклонной буквой i спереди также мигала синим. На маленьком экране иногда отображалось “Нераспознанный код поста”, а иногда номер сервисного тега.
Я попробовал перезагрузить сервер и получил две ошибки: UEFI0315 (Невозможно обработать запрос iDRAC для настройки ключей безопасной загрузки из-за ошибки связи между BIOS и iDRAC.
) и UEFI0029 (Невозможно инициализировать iDRAC из-за критических проблем.
). Я отключил сервер на несколько минут, включил его снова, и он загрузился нормально. Однако у меня все еще сохраняется странное поведение вентиляторов (кажется, они более последовательно громкие, а не включенные и выключенные), а маленькая кнопка/экран, похоже, проходит через несколько состояний: полностью выключена, включена и показывает сервисный тег без мигающих огней, мигающие огни, затем “Нераспознанный код поста” на экране. Затем экран становится черным, кнопка начинает гореть синим цветом, синий свет сзади гаснет и возвращается к черному экрану без подсветки. Кажется, что iDRAC или то, что управляет экраном, находится в каком-то цикле загрузки, а сам сервер работает нормально.
Я перезагрузил сервер, чтобы посмотреть меню F2. Версия BIOS 2.13.0. Версия iDRAC 2.83.83, а в журнале нет ничего важного (единственное, что я нашел за последние месяцы, это обычные вещи, такие как открытие/закрытие корпуса или отключение блоков питания). Я пытался выйти и вернуться, и сказали, что iDRAC в это время не включен, что, возможно, подтверждает гипотезу о том, что iDRAC выключается и включается снова в цикле (также, возможно, объясняя, почему шум вентиляторов был не постоянно громким, а иногда).
Кто-нибудь знает, что это может быть или как я могу это исправить? Стоит ли мне попробовать обновить прошивку UEFI или iDRAC? Есть ли следующий шаг, который я мог бы предпринять, чтобы выяснить причину проблемы? Спасибо!
Обновление: Я сменил материнскую плату на совершенно новую, обновил BIOS и прошивку iDRAC за 8 лет до самых последних версий, и как только я переключился на UEFI и загрузился в объем с ОС, проблема вернулась. Я в замешательстве.
У нас была такая же проблема, сброс iDRAC решил её для нас. Вот список вещей, которые нужно проверить:
Наверняка вы уже сделали некоторые из них, но проверьте, чтобы все аппаратные компоненты были надежно подключены, включая модули памяти, блоки питания и любые дополнительные аппаратные компоненты. Мигающий синий свет просто означает, что что-то не так.
Переустановите модуль iDRAC, если он съемный.
Сброс iDRAC иногда может решить проблемы с коммуникацией.
Вы можете сбросить iDRAC через настройки iDRAC в BIOS или через SSH, если у вас есть доступ к интерфейсу iDRAC:
racadm racreset hard
Если это не сработало, продолжайте с этими шагами:
Выключите сервер.
Отключите все кабели питания.
Зажмите кнопку питания на 30 секунд, чтобы разрядить остаточную энергию.
Подключите кабели питания и включите сервер снова.
Вы очистили журнал событий системы (SEL)?
Иногда полный SEL может вызвать проблемы. Очистите SEL через BIOS или интерфейс iDRAC.
Все еще не работает? Тогда продолжайте с этими:
Обновите прошивку:
Хотя вы и обновили прошивку BIOS и iDRAC, убедитесь, что все компоненты прошивки, включая контроллер жизненного цикла и контроллер RAID, обновлены.
Скачайте последние обновления с сайта поддержки Dell и примените их методично.
Убедитесь, что сервер не перегревается. Очистите пыль с вентиляторов и воздуховодов.
Примечание: Неисправные датчики температуры или скорости вентилятора могут вызывать непредсказуемое поведение вентиляторов.
Проверьте настройки UEFI/BIOS:
Дважды проверьте все настройки UEFI/BIOS, связанные с iDRAC и конфигурациями безопасной загрузки, чтобы убедиться, что они настроены правильно.
Рассмотрите возможность сброса настроек BIOS до заводских и повторной их конфигурации.
Замените аппаратное обеспечение iDRAC (если возможно):
Если проблема сохраняется, рассмотрите возможность замены модуля iDRAC, если он является отдельным компонентом. (новый стоит около 90 долларов)
Проверьте журналы iDRAC:
Получите доступ к веб-интерфейсу iDRAC и перейдите в раздел журналов, чтобы проверить наличие критических ошибок или предупреждений.
Диагностика Dell:
Запустите встроенный инструмент диагностики Dell из BIOS или через контроллер жизненного цикла, чтобы выявить любые проблемы с аппаратным обеспечением.
Проверьте с минимальной конфигурацией:
Уберите несущественные компоненты (дополнительные модули памяти, карты PCI и т.д.) и протестируйте сервер с минимальной конфигурацией, чтобы увидеть, сохраняется ли проблема.
Просмотрите совместимость прошивки:
Убедитесь, что нет проблем совместимости между версиями прошивки различных компонентов (iDRAC, BIOS, контроллер RAID и т.д.).
Настройка сети:
Проверьте, правильно ли настроены сетевые настройки для iDRAC и нет ли сетевых проблем, вызывающих непредсказуемое поведение iDRAC.
В теории, решение можно найти в этом документе: https://dl.dell.com/topicspdf/poweredge-r530_owners-manual_en-us.pdf
Удачи!
У меня такая же проблема. Пожалуйста, скажите, удалось ли вам ее решить?
Ответ или решение
Возможные проблемы с iDRAC: "Нераспознанный код POST", громкие вентиляторы и мигающая кнопка
Ваша проблема с сервером Dell PowerEdge R530 может быть связана с несколькими факторами, которые стоит детально рассмотреть. Судя по описанию, вы столкнулись с рядом симптомов, среди которых громкие вентиляторы, мигательный индикатор и сообщение "Нераспознанный код POST". Этот набор симптомов указывает на возможные проблемы с системой управления iDRAC (Integrated Dell Remote Access Controller), связанную как с программным, так и с аппаратным обеспечением.
1. Предварительная диагностика
-
Проверка аппаратного обеспечения: Убедитесь, что все компоненты сервера (память, блоки питания, дополнительные карты и т.д.) надежно подключены. В случае наличия ослабленных соединений могут возникнуть нестабильности, приводящие к описанным вами симптомам.
-
Перезагрузка iDRAC: Рекомендуется выполнить сброс iDRAC. Это можно сделать через интерфейс iDRAC, BIOS или используя SSH-команды, например:
racadm racreset hard
-
Очистка журнала событий системы (SEL): Полный SEL может вызывать проблемы в системах. Проверьте и очистите его через BIOS или интерфейс iDRAC.
2. Обновление прошивки
Вы уже обновили BIOS и iDRAC до последних версий, что является правильным шагом. Тем не менее, убедитесь, что также обновлены драйверы всех остальных компонентов, таких как контроллер RAID и Lifecycle Controller. Обновления могут помочь устранить несовместимости, вызывающие отключение iDRAC.
3. Проверка конфигураций BIOS/UEFI
Проверьте настройки BIOS/UEFI, особенно связанные с iDRAC и функцией Secure Boot. Если возможно, выполните сброс настроек до заводских и заново настройте систему, исключая конфликтующие параметры.
4. Аппаратные сбои
Иногда проблемы могут быть связаны с каким-либо компонентом сервера, например, с модулями памяти или материнской платой. Если у вас есть возможность, протестируйте сервер с минимальной конфигурацией — отключите дополнительные модули памяти и устройства.
5. Диагностика на уровне сервера
Используйте встроенные диагностические инструменты Dell. В BIOS или через интерфейс Lifecycle Controller можно запустить тесты, которые помогут выявить аппаратные сбои.
6. Замена аппаратных компонентов
Если вопросы с iDRAC продолжаются даже после всех проверок и обновлений, возможно, стоит рассмотреть замену самого модуля iDRAC. Это относительно недорогой вариант, который может значительно упростить решение вашей проблемы.
Заключение
На основании вашего описания, у вас может быть несколько возможностей для устранения проблемы. Пошагово следуя перечисленным рекомендациям, вы сможете сузить круг возможных причин и, надеюсь, устранить возникшие неисправности. Если ни один из вышеуказанных шагов не решает вашу проблему, возможно, стоит обратиться в службу технической поддержки Dell для дальнейшего анализа и рекомендаций. Удачи в вашей работе с сервером!