HP ProLiant DL580 G7 не проходит POST после наводнения [закрыто]

Вопрос или проблема

У меня есть Proliant DL580 G7, который работал до того, как вода попала в корпус.

4x Xeon E7-4807 и 192 Гб DDR3 @ 1333 МГц (катридж E7) без платы расширения I/O.

Он не проходит POST с кодом 80, чередующимся с кодом 00 на 7-сегментном дисплее на системной плате.

Блок питания от другого сервера, который работает.

Сервер запускается на 2 секунды, затем останавливается и повторяет цикл 4 раза, после чего светодиод состояния мигает красным.
Я могу получить доступ к ILO3, но поскольку сервер не проходит POST, я не вижу ничего в логах. На экране нет вывода.

Оригинальные детали перечислены ниже:

Название #HP PN# SN# SP# Rev Версия
Плата разветвления блока питания 590515-001 591202-001
SPI плата 4K1265 512844-001 591199-001 REV.0B V.B02
Системная плата 4K1265 512843-001 591196-001 REV.0B V.B03
ЦП плата 4K1255 583367-001 591197-001 REV.0A V.A06

Приобретено на ebay в состоянии б/у (я выделил разницу с старой частью):

Название #HP PN# SN# SP# Rev Версия
Плата разветвления блока питания 590515-001 591202-001
SPI плата 4K10A5 512844-001 591199-001 REV.0A V.A02
Системная плата 4K1115 512843-001 591196-001 REV.0B V.B01
ЦП плата 4K1215 583367-001 591197-001 REV.0A V.A06

Наклейка на чипе CPLD показывает 0x1010 EB96 на обеих старой и “новой” ЦП плате

Но когда я подключаю все “новые детали”, я получаю то же самое поведение, что и раньше (5 циклов загрузки без POST и светодиод состояния мигает красным).

На ilo3, с “новой” SPI платой (обновленной с помощью прошивки v1.94), я не вижу никакой ROM или резервной ROM, тогда как на старой показывалась P65 ROM.

Я попытался запустить на минимальной конфигурации:
1 ЦП, 1 или 2 памяти E7 с только 8Г или 16Г на катридж, без SAS, без DVD, без PCIe.

Я протестировал все свои четыре ЦП в каждом слоте один за другим.

  • Когда ЦП установлен только в слоте #1, поведение не изменяется
  • Когда ЦП установлен только в слоте #2 или #3 или #4, поведение изменяется:
    • Я не получаю цикл загрузки, но через несколько секунд слышен длинный сигнал, и все светодиоды памяти на SID включены (янтарный) с кодом 40 на 7-сегментном дисплее. В Ilo3 я получаю ошибку конфигурации памяти.
    • Я использовал удалённую консоль (Java-версию), но она показывает “нет видео”. Если я перезапускаю сервер с консолью, я вижу (в строке задач консоли) POST CODE 3038, затем POST CODE 18 и POST CODE 4048

Я читал несколько тем, которые говорили, что сервер не загружается, если ЦП E7 установлен в слоте #3 с платой ЦП версии A. Но, похоже, моя “новая” плата версия B.

Таким образом, кажется, что проблема связана с ЦП слотом #1 даже с “новыми” деталями. Я не понимаю, почему.

Может быть, все мои 4 ЦП мертвы, но это было бы довольно совпадение. Я заказал подержанный ЦП E7-4807, но пока не получил его.

Может быть, купленная мной деталь несовместима с этим ЦП или версией/ревизией.

Ответ или решение

Проблема с сервером HP ProLiant DL580 G7, который не проходит POST после затопления, может иметь несколько причин, особенно если на аппаратуру попала вода. Ниже приведены шаги для диагностики и возможные решения этой ситуации.

### 1. Внешний осмотр и очистка
Первым делом следует провести внешний осмотр сервера. Убедитесь, что внутри нет видимых следов влаги, коррозии или загрязнений. Если вода попала внутрь, необходимо удалить всю влагу и грязь при помощи изопропилового спирта и убедиться, что все компоненты сухие.

### 2. Замена компонентов
Судя по вашему описанию, вы уже заменили некоторые компоненты на другие б/у. Однако ваши новые компоненты могут быть несовместимыми. Проверьте следующее:
– Все компоненты, такие как материнская плата, процессоры и модули памяти, должны быть совместимы между собой. Особенно обратите внимание на версию и ревизию.
– Убедитесь, что вы используете рекомендованные модули памяти по спецификациям HP для вашего сервера.

### 3. Минимальная конфигурация
Вы уже провели тестирование с минимальной конфигурацией, что является правильным шагом. Однако, попробуйте следующие комбинации:
– Поместите один процессор в слот #1, но также попробуйте тестировать его в слоте #2, #3 и #4 по одному.
– Используйте только один модуль памяти в разных слотах, чтобы исключить проблему с памятью.

### 4. POST коды
– Код 80 часто указывает на проблему с загрузкой BIOS или проблемой с питанием компонентов. Код 00 может означать проблему с начальной инициализацией системы.
– Код 40 вместе с мигающим светодиодом здоровья часто связан с неисправностью памяти. Если все модули памяти работают вне сервера, попробуйте протестировать их по одному.

### 5. iLO и Firmware
Раз вы можете получить доступ к iLO, это полезно для диагностики, но если там отсутствуют необходимые ROM, возможно, вам необходимо восстановить прошивку SPI. Попробуйте загрузить последнюю версию прошивки для вашего сервера и выполнить ее обновление через iLO или локально.

### 6. Проверка питания
Проверьте питание на всех компонентах. Убедитесь, что блоки питания полностью функционируют и обеспечивают нужное напряжение на всех шинах. Поскольку вы указали, что используете БП от другого сервера, возможно, стоит вернуть оригинальный БП на место для диагностики.

### 7. Предположения о процессорах
Хотя вероятность того, что все процессоры повреждены, невелика, это вполне возможно. Если у вас есть доступ к другим совместимым процессорам, попробуйте протестировать сервер с ними.

### 8. Подключения и разъемы
Всегда проверяйте все подключения и разъемы на предмет физического повреждения или коррозии. Также стоит провести осмотр на предмет повреждений разъемов на материнской плате или других платах.

### Заключение
Если ни одно из этих решений не помогло, возможно, сервер получил повреждение на уровне материнской платы или других важных компонентов. В этом случае может потребоваться обращение к специалистам по ремонту оборудования или замена материнской платы и процессоров на новые.

Оцените материал
Добавить комментарий

Капча загружается...