Мой Dell R720 загружается только после жесткой перезагрузки — iDRAC и кнопка питания не работают после выключения [закрыто]

Вопрос или проблема

Я столкнулся с раздражающей проблемой с этим б/у сервером Dell PowerEdge R720, который я только что купил, и надеюсь, что кто-то здесь сможет помочь мне разобраться в этом!

Проблема:

После сброса всего к заводским настройкам и обновления всех прошивок до последних версий (кроме одной, об этом позже), я заметил, что каждый раз, когда мой сервер выключается (благополучно или нет), он переходит в состояние, когда:

  • Сервер не включается снова при нажатии кнопки питания.
  • iDRAC полностью отключается
    • (нет IPMI, нет веб-доступа, нет активности ЖК-дисплея.)
  • единственный признак жизни, когда он
    попадает в это состояние, – это несколько светодиодов на материнской плате (например,
    слоты PCIe сзади), но никаких вентиляторов или чего-либо подобного (мой R630
    временами включает вентилятор на несколько секунд, когда сервер выключен, не уверен, нормальна ли отсутствие активности вентилятора для R720)
Единственный способ вернуть его к жизни – это выполнить полный жесткий сброс:
  1. Отключите блоки питания.
  2. Уберите батарею CMOS.
  3. Удерживайте кнопку питания, чтобы разрядить остаточное напряжение.
  4. Замените батарею CMOS, подключите питание, и затем сервер загружается нормально (автоматически включается без нажатия кнопки питания).

Дополнительные детали:

  1. Кнопка питания работает для выключения сервера, если он уже работает, но она не включает его снова.
  2. Как только он включен/в процессе работы, все работает нормально, и iDRAC доступен и функционирует.
  3. Перезагрузки (через Ctrl + Alt + Del) проходят без проблем и не приводят к отключению системы + iDRAC.
  4. Диагностика (тесты ePSA и Lifecycle Controller) не выявляет аппаратных проблем.

Что я пытался сделать:

  1. Сброс до заводских настроек:

    • Сбросил все настройки BIOS до значений по умолчанию и убедился, что “iDRAC Power On” включен.
  2. Обновления прошивки:

    • Обновил прошивку BIOS, iDRAC и Lifecycle Controller до последних версий с помощью утилиты обновления серверов Dell.
    • Единственное исключение – прошивка БП, для которой требуется (по данным обновления прошивки dell) благополучное завершение работы системы, а затем подождите 3-10 минут, чтобы позволить установить прошивку.
      • Это было бы катастрофой для меня, потому что все благополучные завершения работы приводят к состоянию “выключено”, которое я испытываю, когда iDRAC и все прочее отключено. Что, (по данным прошивки) предупреждений, может вывести из строя БП
  3. Батарея CMOS:

    • Проверил напряжение батареи CMOS (~3V), оно в порядке.
  4. Блоки питания:

    • Оба резервных БП в порядке (зеленый индикатор состояния).
  5. Физические проверки:

    • Проверил материнскую плату на наличие видимых повреждений (конденсаторы, дорожки и т.д.)
      — ничего подозрительного не нашел.

Я планирую хранить этот сервер на чердаке в рамках своей домашней лаборатории, но тот факт, что он не включается снова без полного физического сброса, является большим неудобством. Мне нужен надежный способ удаленно включать его снова.

Я почти готов подключить БП к умному PDU и Raspberry Pi внутри сервера как переключатель батареи CMOS, лол.

Кто-нибудь сталкивался с этой проблемой на своих серверах PowerEdge? Может ли это быть неисправность материнской платы или что-то еще, что я упустил? Любые идеи, исправления или даже креативные обходные пути будут крайне признательны!

Заранее спасибо, и дайте мне знать, если я могу предоставить больше информации!

.

Ответ или решение

Проблема с сервером Dell R720: Необходима полная перезагрузка для включения

Введение

Проблема, с которой вы столкнулись на вашем сервере Dell PowerEdge R720, действительно вызывает беспокойство. Сервер не реагирует на нажатие кнопки питания и не активирует iDRAC после отключения или перезагрузки, что является значительным неудобством, особенно для использования в домашних лабораториях. В этой статье мы рассмотрим возможные причины, методы диагностики и варианты решений данной проблемы.

Симптомы проблемы

Согласно вашему описанию, основными симптомами являются:

  1. Невозможность включить сервер с помощью кнопки питания после завершения работы.
  2. Полное отключение iDRAC, которое проявляется отсутствием IPMI, веб-доступа и активности ЖК-дисплея.
  3. Сервер проявляет лишь минимальную активность с помощью светодиодов на материнской плате (например, свет на слотах PCIe), но не включаются вентиляторы.

Что вы уже попробовали

Вы проделали ряд шагов, включая:

  • Сброс всех настроек BIOS и обновление прошивки, за исключением прошивки блока питания, так как это требует процедуры, небезопасной для вашего текущего состояния.
  • Проверка работоспособности батареи CMOS (~3V) и состояния источников питания (зеленый свет).
  • Визуальный осмотр материнской платы на наличие повреждений.

Возможные причины и пути решения

1. Проблемы с материнской платой

Судя по описанию, поведение сервера может указывать на неполадки с материнской платой. Рекомендуется:

  • Проверить конфигурацию системных настроек BIOS. Убедитесь, что все параметры, касающиеся управления питанием и iDRAC, настроены корректно.
  • Обновить/переустановить драйверы iDRAC, даже если они кажутся актуальными.

2. Прошивка блока питания (PSU)

Несмотря на ваш страх "обрушить" PSU, обновление прошивки блока питания может решить основную проблему управления питанием. Если есть возможность:

  • Попробуйте временно отключить сервер от сети и провести новую попытку обновления, следуя указаниям Dell.

3. Проблемы с внутренними соединениями

Проблема может быть связана с внутренними соединениями:

  • Проверьте все кабели и соединения внутри сервера, убедитесь, что они надежно подключены и не имеют повреждений.

4. Варианты обхода

Если проблема продолжает сохраняться, может быть полезно рассмотреть некоторые обходные решения:

  • Установка Умного PDU: Как вы уже упоминали, установка умного распределительного устройства (PDU) может помочь вам контролировать питание сервера удаленно. Это позволит вам включать питание без физического доступа к серверу.
  • Использование Raspberry Pi как переключателя: Эта идея имеет смысл. Установка динамически управляемого переключателя может помочь в восстановлении питания без необходимости полного сброса.

Заключение

Ваш случай, безусловно, вызывает много вопросов и требует внимания. Если после выполнения всех предложенных шагов проблема останется нерешенной, возможно, стоит обратиться к официальной поддержке Dell или рассмотреть вариант замены материнской платы, так как единственным доступным переключателем является кнопка питания, которая, похоже, не исполняет свою функцию должным образом.

Мы надеемся, что эта информация поможет вам диагностировать и устранить проблемы с вашим сервером Dell PowerEdge R720. Если возникнут дополнительные вопросы, не стесняйтесь задавать их, предоставляя больше деталей о ситуации.

Оцените материал
Добавить комментарий

Капча загружается...