Вопрос или проблема
У меня есть Proliant DL580 G7, который работал до того, как вода попала в корпус.
4x Xeon E7-4807 и 192 Гб DDR3 @ 1333 МГц (катридж E7) без платы расширения I/O.
Он не проходит POST с кодом 80, чередующимся с кодом 00 на 7-сегментном дисплее на системной плате.
Блок питания от другого сервера, который работает.
Сервер запускается на 2 секунды, затем останавливается и повторяет цикл 4 раза, после чего светодиод состояния мигает красным.
Я могу получить доступ к ILO3, но поскольку сервер не проходит POST, я не вижу ничего в логах. На экране нет вывода.
Оригинальные детали перечислены ниже:
Название | #HP | PN# | SN# | SP# | Rev | Версия |
---|---|---|---|---|---|---|
Плата разветвления блока питания | – | 590515-001 | 591202-001 | – | – | – |
SPI плата | 4K1265 | 512844-001 | – | 591199-001 | REV.0B | V.B02 |
Системная плата | 4K1265 | 512843-001 | – | 591196-001 | REV.0B | V.B03 |
ЦП плата | 4K1255 | 583367-001 | – | 591197-001 | REV.0A | V.A06 |
Приобретено на ebay в состоянии б/у (я выделил разницу с старой частью):
Название | #HP | PN# | SN# | SP# | Rev | Версия |
---|---|---|---|---|---|---|
Плата разветвления блока питания | – | 590515-001 | 591202-001 | – | – | – |
SPI плата | 4K10A5 | 512844-001 | – | 591199-001 | REV.0A | V.A02 |
Системная плата | 4K1115 | 512843-001 | – | 591196-001 | REV.0B | V.B01 |
ЦП плата | 4K1215 | 583367-001 | – | 591197-001 | REV.0A | V.A06 |
Наклейка на чипе CPLD показывает 0x1010 EB96
на обеих старой и “новой” ЦП плате
Но когда я подключаю все “новые детали”, я получаю то же самое поведение, что и раньше (5 циклов загрузки без POST и светодиод состояния мигает красным).
На ilo3, с “новой” SPI платой (обновленной с помощью прошивки v1.94), я не вижу никакой ROM или резервной ROM, тогда как на старой показывалась P65 ROM.
Я попытался запустить на минимальной конфигурации:
1 ЦП, 1 или 2 памяти E7 с только 8Г или 16Г на катридж, без SAS, без DVD, без PCIe.
Я протестировал все свои четыре ЦП в каждом слоте один за другим.
- Когда ЦП установлен только в слоте #1, поведение не изменяется
- Когда ЦП установлен только в слоте #2 или #3 или #4, поведение изменяется:
- Я не получаю цикл загрузки, но через несколько секунд слышен длинный сигнал, и все светодиоды памяти на SID включены (янтарный) с кодом 40 на 7-сегментном дисплее. В Ilo3 я получаю ошибку конфигурации памяти.
- Я использовал удалённую консоль (Java-версию), но она показывает “нет видео”. Если я перезапускаю сервер с консолью, я вижу (в строке задач консоли)
POST CODE 3038
, затемPOST CODE 18
иPOST CODE 4048
Я читал несколько тем, которые говорили, что сервер не загружается, если ЦП E7 установлен в слоте #3 с платой ЦП версии A. Но, похоже, моя “новая” плата версия B.
Таким образом, кажется, что проблема связана с ЦП слотом #1 даже с “новыми” деталями. Я не понимаю, почему.
Может быть, все мои 4 ЦП мертвы, но это было бы довольно совпадение. Я заказал подержанный ЦП E7-4807, но пока не получил его.
Может быть, купленная мной деталь несовместима с этим ЦП или версией/ревизией.
Ответ или решение
Проблема с сервером HP ProLiant DL580 G7, который не проходит POST после затопления, может иметь несколько причин, особенно если на аппаратуру попала вода. Ниже приведены шаги для диагностики и возможные решения этой ситуации.
### 1. Внешний осмотр и очистка
Первым делом следует провести внешний осмотр сервера. Убедитесь, что внутри нет видимых следов влаги, коррозии или загрязнений. Если вода попала внутрь, необходимо удалить всю влагу и грязь при помощи изопропилового спирта и убедиться, что все компоненты сухие.
### 2. Замена компонентов
Судя по вашему описанию, вы уже заменили некоторые компоненты на другие б/у. Однако ваши новые компоненты могут быть несовместимыми. Проверьте следующее:
– Все компоненты, такие как материнская плата, процессоры и модули памяти, должны быть совместимы между собой. Особенно обратите внимание на версию и ревизию.
– Убедитесь, что вы используете рекомендованные модули памяти по спецификациям HP для вашего сервера.
### 3. Минимальная конфигурация
Вы уже провели тестирование с минимальной конфигурацией, что является правильным шагом. Однако, попробуйте следующие комбинации:
– Поместите один процессор в слот #1, но также попробуйте тестировать его в слоте #2, #3 и #4 по одному.
– Используйте только один модуль памяти в разных слотах, чтобы исключить проблему с памятью.
### 4. POST коды
– Код 80 часто указывает на проблему с загрузкой BIOS или проблемой с питанием компонентов. Код 00 может означать проблему с начальной инициализацией системы.
– Код 40 вместе с мигающим светодиодом здоровья часто связан с неисправностью памяти. Если все модули памяти работают вне сервера, попробуйте протестировать их по одному.
### 5. iLO и Firmware
Раз вы можете получить доступ к iLO, это полезно для диагностики, но если там отсутствуют необходимые ROM, возможно, вам необходимо восстановить прошивку SPI. Попробуйте загрузить последнюю версию прошивки для вашего сервера и выполнить ее обновление через iLO или локально.
### 6. Проверка питания
Проверьте питание на всех компонентах. Убедитесь, что блоки питания полностью функционируют и обеспечивают нужное напряжение на всех шинах. Поскольку вы указали, что используете БП от другого сервера, возможно, стоит вернуть оригинальный БП на место для диагностики.
### 7. Предположения о процессорах
Хотя вероятность того, что все процессоры повреждены, невелика, это вполне возможно. Если у вас есть доступ к другим совместимым процессорам, попробуйте протестировать сервер с ними.
### 8. Подключения и разъемы
Всегда проверяйте все подключения и разъемы на предмет физического повреждения или коррозии. Также стоит провести осмотр на предмет повреждений разъемов на материнской плате или других платах.
### Заключение
Если ни одно из этих решений не помогло, возможно, сервер получил повреждение на уровне материнской платы или других важных компонентов. В этом случае может потребоваться обращение к специалистам по ремонту оборудования или замена материнской платы и процессоров на новые.