DL580 G7 не загружается после замены компонентов

Вопрос или проблема

У меня проблема с сервером Proliant DL580 G7.

Сервер работал хорошо до того, как в корпус попала вода.

У него было 4x Xeon E7-4807 и 192 Гб DDR3 @ 1333 МГц (картридж E7) без платы расширения I/O.

После попадания воды сервер не проходит POST, и я получаю код 80, который чередуется с кодом 00 на 7-сегментном дисплее на системной плате.

Блок питания пришел от другого рабочего сервера.

Сервер запускается на 2 секунды, затем останавливается и зацикливается 4 раза, после чего индикатор состояния мигает красным.

Я могу получить доступ к Ilo3, но поскольку сервер не проходит POST, в журналах ничего нет. Нет отображения на экране.

Оригинальные детали перечислены ниже:

Название #HP PN# SN# SP# Rev Версия
Плата разветвителя блока питания 590515-001 591202-001
Плата SPI 4K1265 512844-001 591199-001 REV.0B V.B02
Системная плата 4K1265 512843-001 591196-001 REV.0B V.B03
Плата CPU 4K1255 583367-001 591197-001 REV.0A V.A06

Я купил все эти детали на eBay в б/у состоянии (я выделил разницу с оригинальными частями):

Название #HP PN# SN# SP# Rev Версия
Плата разветвителя блока питания 590515-001 591202-001
Плата SPI 4K10A5 512844-001 591199-001 REV.0A V.A02
Системная плата 4K1115 512843-001 591196-001 REV.0B V.B01
Плата CPU 4K1215 583367-001 591197-001 REV.0A V.A06

Наклейка на микросхеме CPLD показывает 0x1010 EB96 как на старой, так и на “новой” плате CPU.

Но когда я подключаю все “новые детали”, я получаю такое же поведение, как и раньше (5 циклов загрузки без POST и индикатор состояния мигает красным).

На ilo3, с “новой” платой SPI (обновленной до прошивки v1.94), я не вижу ни ROM, ни резервного ROM, а на старой плате я видел P65 ROM.

Я пытался запустить сервер в минимальной конфигурации: 1 CPU, 1 или 2 картриджа памяти E7 с только 8 ГБ или 16 ГБ на картридж, без SAS, без DVD, без PCIe.

Я протестировал все четыре процессора в каждом слоте по одному.

  • Когда процессор установлен только в слот #1, поведение не меняется
  • Когда процессор установлен только в слоты #2 или #3 или #4, поведение изменяется:
    • Я не получаю зацикливание загрузки, но через несколько секунд я слышу длинный сигнал и все индикаторы памяти на SID светятся (янтарный цвет) с кодом 40 на 7-сегментном индикаторе. В Ilo3 я получаю ошибку конфигурации памяти.
    • Я использовал удаленную консоль (java-версия), но она показывает “нет видео”. Если я перезагружу сервер с консолью, я могу увидеть (в строке задач консоли) POST CODE 3038, затем POST CODE 18 и POST CODE 4048.

Я читал некоторые темы, которые говорили, что сервер не загружается, если процессор E7 установлен в слот #3 с платой CPU ревизии A. Но, похоже, моя “новая” плата – ревизия B.

Таким образом, кажется, что проблема связана с слотом процессора #1 даже с “новыми” деталями. Я не знаю почему.

Может быть, все мои 4 процессора неисправны, но это было бы довольно странное стечение обстоятельств. Я заказал б/у процессор E7-4807, но пока не получил его.

Возможно, купленные мной детали несовместимы с этим процессором или версией/ревизией.

Если у кого-то есть идеи, как помочь мне отладить этот сервер, буду признателен!

Спасибо заранее за ваш ответ.

С уважением

Ответ или решение

Здравствуйте!

Ситуация, которую вы описали, действительно сложная, и мне жаль слышать о проблемах с вашим сервером Proliant DL580 G7 после утечки воды. Ниже приведены шаги и рекомендации, которые могут помочь вам диагностировать и, возможно, решить проблему с загрузкой сервера.

### 1. Проверка повреждений от воды
Первое, что необходимо сделать, это тщательно осмотреть все компоненты сервера на наличие повреждений, вызванных влагой. Особенно обратите внимание на материнскую плату, разъемы и любые шины. Если возможно, проведите очистку сжатым воздухом и аккуратно протрите все компоненты, чтобы удалить возможные остатки влаги.

### 2. Минимальная конфигурация
Вы уже начали процесс минимальной конфигурации, но убедитесь, что:
– Установлен только один процессор в слот #1.
– Используется одна DIMM-модуль памяти совместимо с процессором в первом слоте, желательно попробуйте использовать сертифицированную память HP, если она доступна. Часто проблемы с кодами ошибок могут быть связаны с несовместимыми или поврежденными модулями памяти.
– Все остальные карты (SAS, видео и PCIe) полностью отключены.

### 3. Проверка модулей CPU
Вы упомянули, что тестировали все четыре процессора в каждом слоте. Однако стоит отметить, что если функция работы с памятью нарушена из-за повреждения контроллера памяти на любом из процессоров, это также может привести к ошибкам. Если у вас есть возможность, попробуйте проверить процессоры в рабочем сервере, чтобы исключить вероятность их неисправности.

### 4. Проверка совместимости компонентов
Обратите внимание на версию новых компонентов, которые вы приобрели. Убедитесь, что все новые детали, такие как SPI-борд и CPU-борд, совместимы с вашим сервером. Некоторые компоненты могут не поддерживать определенные вариации процессоров Xeon E7, особенно если есть разница в версии и ревизиях плат.

### 5. Состояние светодиодов и кодов POST
Коды, которые вы получаете на 7-сегментном индикаторе и состояние светодиода, могут дать больше информации о проблемах:
– Код 80 обычно указывает на инициализацию аппаратных средств и отсутствие дальнейшего прогресса.
– Код 00 может свидетельствовать о проблеме с прошивкой или ошибке в конфигурации.
– То, что вы видите при включении, может указывать на проблемы с памятью, особенно если вы получаете длинный сигнал при установке в другие слоты.

### 6. Обновление BIOS и прошивки
Если вы сможете получить доступ к iLO, проверьте, установлена ли последняя версия BIOS. Если необходимо, обновите прошивку до последней версии. Обновления могут исправить проблемы совместимости.

### 7. Замена деталей
Возможно, вам придется продолжить тестирование с помощью запасных частей:
– Попробуйте получить другой контроллер напряжения (PSU) и протестировать.
– Если возможно, пересмотрите использованные детали на eBay и постарайтесь найти 100% совместимые с вашим сервером.

### Заключение
Если все вышеперечисленные шаги не будут успешными, возможно, потребуется обратиться в профессиональный сервисный центр для более углубленной диагностики. Иногда проблемы могут быть неочевидными и требовать специализированного оборудования для тестирования.

Если у вас есть дополнительные вопросы или нужна дальнейшая помощь, пожалуйста, дайте знать. Удачи, и надеюсь, что вы скоро вернете сервер в рабочее состояние!

С уважением!

Оцените материал
Добавить комментарий

Капча загружается...