- Вопрос или проблема
- Обзор оборудования
- Мои попытки решить проблему
- Что я еще не попробовал
- Ответ или решение
- 1. Отключение от питания и сброс конфигурации
- 2. Обновление прошивки iLO
- 3. Конфигурация DIP-переключателей
- 4. Проверка выставленных настроек в BIOS
- 5. Замена аппаратных компонентов
- 6. Запрос на техническую поддержку
Вопрос или проблема
Я недавно приобрел HP DL380 G6 для использования в домашних лабораторных условиях и столкнулся с несколькими проблемами, которые, по моему мнению, вызваны неотзывчивым iLO 2:
- POST занимает несколько (например, 5) минут, дольше, чем ожидалось.
- При POST, после заставки, появляется сообщение
Warning: iLO 2 not responding. System health monitoring has been disabled.
- На CentOS 7 с live USB
udev
зависает при обнаружении устройств, аdmesg
показывает, что он пытается взаимодействовать с интерфейсом IPMI и завершается таймаутом. - Загрузка в HP SPP зависает после выбора автоматического / интерактивного режимов, вероятно, потому что он пытается обнаружить iLO и зависает.
- Вентиляторы постоянно работают на 100% мощности.
- Светодиоды состояния системы на передней панели (например, показывающие вентиляторы, слоты памяти, процессоры) все выключены, за исключением индикатора Ethernet 1 (который подключен).
- Обычно на экране POST должно отображаться что-то вроде “Нажмите F8 для входа в утилиту настройки на базе ROM iLO”, но этого не появляется, и я не могу настроить iLO.
- iLO вообще не появляется в сети. Никакой пинг, никаких IP, ничего.
Обзор оборудования
- HP DL380 G6 с последним обновлением BIOS, другое ПО не обновлено
- 48 ГБ ОЗУ
- 2x процессора Intel Xeon X5560
- Интегрированная RAID-карта P410i, установлена карта LSI 9211-8i с последним (P20) прошивкой IT
- Начальная версия iLO: неизвестно. (Я обновил ее до 2.33, не уверен, что это было успешно.)
Мои попытки решить проблему
(Никакая из них не сработала.)
- Согласно этому сайту, полный сброс питания обычно помогает сделать iLO отзывчивым. В моем случае я отключил шнур питания и нажимал кнопку питания 30 секунд, но при следующей загрузке iLO остается неотзывчивым.
- Я обновил BIOS до последней версии. Это ничего не изменило.
- Я обновил прошивку iLO до последней версии, v2.33, с помощью ISO HP SPP, записанного на USB-накопитель под управлением CentOS 7. Это сработало, но необходимо было прошить в прямом режиме, и даже после дополнительного сброса питания iLO остается неотзывчивым.
- Попробовал переключатель безопасности iLO, устанавливая его как в включенное, так и в выключенное положение.
- Сбросил настройки NVRAM (а значит, и iLO), сняв батарею с кнопки в сервере, а затем установив ее обратно.
Что я еще не попробовал
У меня сейчас нет физического доступа к серверу, но завтра он будет доступен, и я попробую следующее:
- Согласно сомнительному российскому сайту, возможно, прошивка прошивки iLO 1.77 в прямом режиме с CD с прошивкой 8.50 может это исправить.
- Я еще не вынимал блоки питания физически из сервера во время своих предыдущих сбросов питания, поэтому возможно, что iLO каким-то образом удерживало питание и не перезагрузилось?! Хотя не уверен, что это действительно важно.
Если кто-либо сталкивался с этой проблемой или имеет советы о том, как с ней справиться, буду признателен.
Если вы купили его целым, на внутренней стороне крышки должна быть этикетка. На ней должно быть изображение переключателя для сброса CMOS (возврат к заводским настройкам). Это комбинация многопозиционных переключателей, и когда вы его включаете, вы получаете звуковой код, затем вы устанавливаете их обратно после выключения питания.
Многое из того, что вы описываете, можно настроить в BIOS и iLO (вы можете настроить iLO на отключение iLO). Один из способов восстановить его – восстановить заводские настройки, но это связано с собственными рисками. Судя по всему, вы хотя бы теперь загружаетесь.
Кстати, снятие батареи может сбросить CMOS, но если вы сделаете это слишком быстро, я сомневаюсь, что все настройки будут сброшены. Мы раньше заземляли это или пытались закрыть питающую шину. Вы будете удивлены, сколько емкости в системе.
Это старый вопрос и очень старый сервер, но, возможно, это поможет кому-то.
Для меня обновление iLO2 до 2.33 сделало iLO недоступным. Сервер находился далеко, но у меня был доступ к работающей ОС и сети. Уменьшение до 2.32 решило все проблемы. Я смог это сделать через TFTP-загрузку, которую я инициировал с помощью hponcfg.
Ответ или решение
Как исправить неоткликающийся iLO 2 на сервере HP DL380 G6?
На основании того, что вы описали, у вашего iLO 2 могут быть несколько проблем, которые приводят к его неработоспособности. Ниже приведены шаги, которые вы можете предпринять для решения этих проблем.
1. Отключение от питания и сброс конфигурации
Как вы уже пробовали, отключение питания и разрядка конденсаторов может помочь. Однако также рекомендуется выполнить следующие действия:
- Полный сброс NVRAM: Убедитесь, что вы удалили батарейку на материнской плате (если это не помогло ранее, попробуйте оставить её на дольше, например, на 10-15 минут).
- Физическое отключение источников питания: Удалите блоки питания из сервера на время, чтобы гарантировать полное отключение питания. Это может быть критично для решения проблем с iLO.
2. Обновление прошивки iLO
Так как вы уже обновили прошивку до версии 2.33, и это не решило проблему, попробуйте следующее:
- Понижение версии iLO: Если возможно, попробуйте вернуть прошивку к версии 2.32. Это можно сделать с помощью TFTP и hponcfg, если у вас есть доступ к операционной системе сервера. Иногда некоторые версии прошивки могут быть несовместимыми с конкретным оборудованием.
3. Конфигурация DIP-переключателей
Некоторые серверы имеют DIP-переключатели для сброса настроек iLO или NVRAM. Убедитесь, что вы правильно настроили все соответствующие переключатели. Вы можете найти схему расположения переключателей внутри корпуса сервера, обычно на его крышке.
4. Проверка выставленных настроек в BIOS
- Зайдите в BIOS и проверьте настройки iLO. Убедитесь, что iLO не отключен в настройках BIOS. Иногда могут быть установлены конфигурации, которые отключают iLO, и это может быть источником ваших проблем.
5. Замена аппаратных компонентов
- Если ни один из вышеперечисленных шагов не помог, возможно проблема в аппаратной части iLO. Если есть возможность, попробуйте заменить плату управления iLO (если доступна) либо всю материнскую плату, чтобы устранить возможность аппаратного сбоя.
6. Запрос на техническую поддержку
Если все вышеперечисленные шаги не помогли, возможно стОит обратиться в техническую поддержку HP или обратиться за помощью к сообществам владельцев серверов HP, так как они могут предложить дополнительные решения, основанные на аналогичном опыте.
Принятие всех этих мер может помочь восстановить функциональность вашего iLO 2 и устранить проблемы, описанные вами. Удачи вам в решении данной задачи!