Вопрос или проблема
У меня немного необычная сборка на базе Xeon, которую я использую как сервер для компиляции/сборки/тестирования. Изначально я тестировал его с блоком питания Seasonic M12 620W. Я хотел полностью модульный блок питания и приобрел Thermalright TR-TPFX650. Он работает нормально — я тестировал его под нагрузкой с обоими блоками питания. Потребление энергии всей системы составляет ~175 Вт, но это почти полностью идет на процессор или через материнскую плату.
Модель процессора : Intel(R) Xeon(R) CPU E5-2680 v4 @ 2.40GHz
Ядра процессора : 28 @ 1197.103 MHz
ОС : Ubuntu 24.04.1 LTS
Характеристики системы выше — и это та же материнская плата MATX-CS612, как в этом вопросе
С данным процессором — он перезагружается примерно каждые 4 часа или 30 минут, и этот интервал становится все короче и короче. Я могу снова достигнуть примерно 4 часов, если оставлю ПК выключенным, и это довольно легко воспроизводимо. Я осознаю, что машина перезагружается, лишь потому что она издает сигнал при перезагрузке. Есть несколько особенностей — нет очевидных журналов, почему он сбоит, cockpit показывает, что машина перезагрузилась.
Я следил за температурами, и они никогда не превышают 50°C — и машина стабильна с другим блоком питания. Я также тестировал под нагрузкой и термоциклировал машину как часть процесса сборки, так что на 99% уверен, что с процессором все в порядке. У меня было более дня работы на другом блоке питания, так что, думаю, можно исключить перегрев.
Я довольно определенно изолировал проблему к блоку питания.
Последняя перезагрузка показывает несколько активных загрузок — я подозреваю, это из-за нечистого запуска
reboot system boot 6.8.0-48-generic Wed Dec 25 15:46 - 23:29 (07:42)
reboot system boot 6.8.0-48-generic Tue Dec 24 19:29 - 21:36 (02:07)
reboot system boot 6.8.0-48-generic Tue Dec 24 18:45 - 21:36 (02:51)
reboot system boot 6.8.0-48-generic Tue Dec 24 18:41 - 18:44 (00:03)
reboot system boot 6.8.0-48-generic Tue Dec 24 14:25 - 18:44 (04:19)
reboot system boot 6.8.0-48-generic Wed Dec 18 09:04 - 09:05 (00:01)
reboot system boot 6.8.0-48-generic Wed Dec 18 08:29 - 09:05 (00:35)
reboot system boot 6.8.0-48-generic Tue Dec 17 19:58 - 20:03 (00:04)
Что я пытаюсь выяснить, так это проблема с тем, что менее мощный блок питания не работает с данной настройкой, или мне попался некачественный блок питания. У меня есть идеи о тестировании блока питания на других системах с процессором меньшей мощности, но я пытаюсь понять, с чем имею дело, особенно учитывая задержку и сокращение периодов сбоя.
До сих пор я не знаю, в чем проблема с блоком питания, но это был блок питания.
В итоге я вернулся к примерно десятилетнему блоку питания, который использовал изначально, и он работает нормально.
Ответ или решение
На основании описанного случая с вашим сервером на базе Xeon, который периодически перезагружается при использовании блока питания Thermalright TR-TPFX650, можно предположить несколько возможных причин и сценариев развития ситуации. Давайте рассмотрим их более подробно, анализируя предоставленные данные и применяя TEA (Theory, Example, Application) методику для решения и понимания проблемы.
Теоретическая часть
Неполадки в компьютерах, связанные с блоками питания (БП), могут иметь различные проявления. Самые распространенные из них включают в себя:
-
Недостаточная мощность блока питания: Хотя ваш компьютер использует всего около 175 Вт, важно помнить, что устройство должно обеспечивать стабильное напряжение и ток под различными режимами нагрузки, включая пиковые значения.
-
Проблемы с качеством блока питания: Новые блоки питания могут иметь производственные дефекты, которые становятся заметными только при фактическом использовании.
-
Совместимость с материнской платой и процессором: Не все блоки питания одинаково хорошо совместимы с определенными конфигурациями оборудования. Это может проявляться в нестабильной работе при подключении определенных компонентов.
-
Тепловые проблемы и защита от перегрева внутри блока питания: Хотя температура в системе остается в пределах нормы, внутри блока питания может происходить перегрев из-за внутренних проблем или недостаточной вентиляции.
Пример
Рассмотрим ваш случай. Вы используете материнскую плату MATX-CS612 и процессор Intel Xeon E5-2680 v4. При использовании блока питания Seasonic M12 620W система функционирует стабильно, но при переходе на новый Thermalright TR-TPFX650 начинаются периодические перезагрузки. Температура системы остается в пределах нормы, что исключает вероятность перегрева процессора или оперативной памяти. Помимо этого, отсутствуют логические ошибки или записи в журнале, объясняющие внезапные перезагрузки, что усложняет диагностику.
Применение
Основываясь на теории и примерах, можно предложить несколько шагов для решения вашей проблемы:
-
Проверьте линии питания: Убедитесь, что все разъемы плотно подсоединены. Иногда проблемы с контактами могут вызывать перебои в питании.
-
Измерьте выходное напряжение: Используйте мультиметр для проверки стабильности выходного напряжения на различных линиях (12V, 5V, 3.3V). Оно должно оставаться в пределах допустимых отклонений даже под нагрузкой.
-
Тестирование на другом оборудовании: Подключите блок питания к другой системе, которая потребляет меньше энергии, и пронаблюдайте, будет ли аналогичное поведение. Это поможет исключить или подтвердить неисправность блока питания.
-
Проверка совместимости: Узнайте в технической поддержке производителя о совместимости блока питания с вашим текущим оборудованием.
-
Замена БП: Если все вышеперечисленные шаги указывают на проблемы с блоком питания, его следует заменить. Возможно, попытаться обменять его по гарантии или обратиться в магазин для возврата.
-
Прошивка BIOS/UEFI: Убедитесь, что версия BIOS/UEFI вашей материнской платы актуальна. Иногда обновления содержат исправления, влияющие на совместимость с новыми комплектующими.
-
Вентиляция: Проверьте, хватает ли блоку питания охлаждения. Если он установлен в ограниченном по пространству корпусе, убедитесь в отсутствии препятствий для отвода тепла.
Таким образом, подробно проследив вышеперечисленные шаги, вы с большой вероятностью сможете определить корень проблемы и предпринять необходимые меры. Проблемы с блоками питания достаточно распространены, и подход через исключение возможных причин позволяет эффективно их диагностировать. Успехов в решении этой задачи!