Вопрос или проблема
У меня проблема с сервером Proliant DL580 G7.
Сервер работал хорошо до того, как в корпус попала вода.
У него было 4x Xeon E7-4807 и 192 Гб DDR3 @ 1333 МГц (картридж E7) без платы расширения I/O.
После попадания воды сервер не проходит POST, и я получаю код 80, который чередуется с кодом 00 на 7-сегментном дисплее на системной плате.
Блок питания пришел от другого рабочего сервера.
Сервер запускается на 2 секунды, затем останавливается и зацикливается 4 раза, после чего индикатор состояния мигает красным.
Я могу получить доступ к Ilo3, но поскольку сервер не проходит POST, в журналах ничего нет. Нет отображения на экране.
Оригинальные детали перечислены ниже:
Название | #HP | PN# | SN# | SP# | Rev | Версия |
---|---|---|---|---|---|---|
Плата разветвителя блока питания | – | 590515-001 | 591202-001 | – | – | – |
Плата SPI | 4K1265 | 512844-001 | – | 591199-001 | REV.0B | V.B02 |
Системная плата | 4K1265 | 512843-001 | – | 591196-001 | REV.0B | V.B03 |
Плата CPU | 4K1255 | 583367-001 | – | 591197-001 | REV.0A | V.A06 |
Я купил все эти детали на eBay в б/у состоянии (я выделил разницу с оригинальными частями):
Название | #HP | PN# | SN# | SP# | Rev | Версия |
---|---|---|---|---|---|---|
Плата разветвителя блока питания | – | 590515-001 | 591202-001 | – | – | – |
Плата SPI | 4K10A5 | 512844-001 | – | 591199-001 | REV.0A | V.A02 |
Системная плата | 4K1115 | 512843-001 | – | 591196-001 | REV.0B | V.B01 |
Плата CPU | 4K1215 | 583367-001 | – | 591197-001 | REV.0A | V.A06 |
Наклейка на микросхеме CPLD показывает 0x1010 EB96
как на старой, так и на “новой” плате CPU.
Но когда я подключаю все “новые детали”, я получаю такое же поведение, как и раньше (5 циклов загрузки без POST и индикатор состояния мигает красным).
На ilo3, с “новой” платой SPI (обновленной до прошивки v1.94), я не вижу ни ROM, ни резервного ROM, а на старой плате я видел P65 ROM.
Я пытался запустить сервер в минимальной конфигурации: 1 CPU, 1 или 2 картриджа памяти E7 с только 8 ГБ или 16 ГБ на картридж, без SAS, без DVD, без PCIe.
Я протестировал все четыре процессора в каждом слоте по одному.
- Когда процессор установлен только в слот #1, поведение не меняется
- Когда процессор установлен только в слоты #2 или #3 или #4, поведение изменяется:
- Я не получаю зацикливание загрузки, но через несколько секунд я слышу длинный сигнал и все индикаторы памяти на SID светятся (янтарный цвет) с кодом 40 на 7-сегментном индикаторе. В Ilo3 я получаю ошибку конфигурации памяти.
- Я использовал удаленную консоль (java-версия), но она показывает “нет видео”. Если я перезагружу сервер с консолью, я могу увидеть (в строке задач консоли)
POST CODE 3038
, затемPOST CODE 18
иPOST CODE 4048
.
Я читал некоторые темы, которые говорили, что сервер не загружается, если процессор E7 установлен в слот #3 с платой CPU ревизии A. Но, похоже, моя “новая” плата – ревизия B.
Таким образом, кажется, что проблема связана с слотом процессора #1 даже с “новыми” деталями. Я не знаю почему.
Может быть, все мои 4 процессора неисправны, но это было бы довольно странное стечение обстоятельств. Я заказал б/у процессор E7-4807, но пока не получил его.
Возможно, купленные мной детали несовместимы с этим процессором или версией/ревизией.
Если у кого-то есть идеи, как помочь мне отладить этот сервер, буду признателен!
Спасибо заранее за ваш ответ.
С уважением
Ответ или решение
Здравствуйте!
Ситуация, которую вы описали, действительно сложная, и мне жаль слышать о проблемах с вашим сервером Proliant DL580 G7 после утечки воды. Ниже приведены шаги и рекомендации, которые могут помочь вам диагностировать и, возможно, решить проблему с загрузкой сервера.
### 1. Проверка повреждений от воды
Первое, что необходимо сделать, это тщательно осмотреть все компоненты сервера на наличие повреждений, вызванных влагой. Особенно обратите внимание на материнскую плату, разъемы и любые шины. Если возможно, проведите очистку сжатым воздухом и аккуратно протрите все компоненты, чтобы удалить возможные остатки влаги.
### 2. Минимальная конфигурация
Вы уже начали процесс минимальной конфигурации, но убедитесь, что:
– Установлен только один процессор в слот #1.
– Используется одна DIMM-модуль памяти совместимо с процессором в первом слоте, желательно попробуйте использовать сертифицированную память HP, если она доступна. Часто проблемы с кодами ошибок могут быть связаны с несовместимыми или поврежденными модулями памяти.
– Все остальные карты (SAS, видео и PCIe) полностью отключены.
### 3. Проверка модулей CPU
Вы упомянули, что тестировали все четыре процессора в каждом слоте. Однако стоит отметить, что если функция работы с памятью нарушена из-за повреждения контроллера памяти на любом из процессоров, это также может привести к ошибкам. Если у вас есть возможность, попробуйте проверить процессоры в рабочем сервере, чтобы исключить вероятность их неисправности.
### 4. Проверка совместимости компонентов
Обратите внимание на версию новых компонентов, которые вы приобрели. Убедитесь, что все новые детали, такие как SPI-борд и CPU-борд, совместимы с вашим сервером. Некоторые компоненты могут не поддерживать определенные вариации процессоров Xeon E7, особенно если есть разница в версии и ревизиях плат.
### 5. Состояние светодиодов и кодов POST
Коды, которые вы получаете на 7-сегментном индикаторе и состояние светодиода, могут дать больше информации о проблемах:
– Код 80 обычно указывает на инициализацию аппаратных средств и отсутствие дальнейшего прогресса.
– Код 00 может свидетельствовать о проблеме с прошивкой или ошибке в конфигурации.
– То, что вы видите при включении, может указывать на проблемы с памятью, особенно если вы получаете длинный сигнал при установке в другие слоты.
### 6. Обновление BIOS и прошивки
Если вы сможете получить доступ к iLO, проверьте, установлена ли последняя версия BIOS. Если необходимо, обновите прошивку до последней версии. Обновления могут исправить проблемы совместимости.
### 7. Замена деталей
Возможно, вам придется продолжить тестирование с помощью запасных частей:
– Попробуйте получить другой контроллер напряжения (PSU) и протестировать.
– Если возможно, пересмотрите использованные детали на eBay и постарайтесь найти 100% совместимые с вашим сервером.
### Заключение
Если все вышеперечисленные шаги не будут успешными, возможно, потребуется обратиться в профессиональный сервисный центр для более углубленной диагностики. Иногда проблемы могут быть неочевидными и требовать специализированного оборудования для тестирования.
Если у вас есть дополнительные вопросы или нужна дальнейшая помощь, пожалуйста, дайте знать. Удачи, и надеюсь, что вы скоро вернете сервер в рабочее состояние!
С уважением!