Lenovo ThinkPad P14s Gen 4 случайно перезагружается, то же самое и с P16s Gen 2 (Nvidia RTX A500)

Вопрос или проблема

Здравствуйте, сообщество Ubuntu,

У меня возникают случайные выключения и перезагрузки на моем Lenovo ThinkPad P14s Gen 4 с установленной Ubuntu 24.04 LTS, и я ищу помощь в диагностике проблемы. Эти перезагрузки происходят внезапно, без каких-либо зависаний или предупреждений, и мне не удалось воспроизвести проблему по требованию.

Спецификации системы:
Модель: Lenovo ThinkPad P14s Gen 4
Процессор: Intel i7-1370P vPro (13-е поколение)
Оперативная память: 32 ГБ
Хранение: 1 ТБ SSD
Графика: NVIDIA RTX A500 4GB GDDR6, в данный момент с драйвером nouveau, но также протестировано с проприетарным nvidia 550
Версия Ubuntu: 24.04 LTS
Версия ядра: 6.8.0-45-generic

Проблема:
Ноутбук случайно выключается и перезагружается без зависания. Это может происходить несколько раз в день или реже, без четкого паттерна. Это происходит как при легких задачах, так и при более тяжелом использовании, и я не могу постоянно воспроизводить проблему.
На систему почти нет нагрузки, так как я в основном использую ее для удаленной работы через Remmina.
Вентилятор в основном тихий, кроме как при запуске. Иногда я могу работать несколько дней без сбоев, иногда сбои происходят несколько раз в день…

Журналы ошибок показывают довольно много ошибок. Особенно HANDLING IBECC MEMORY ERROR может указывать на ошибку памяти. Но я проводил тестирование памяти и т. д.
Несколько журналов прикреплены в конце, но, пожалуйста, дайте мне знать, если вам нужна дополнительная информация.

Шаги, которые я уже предпринял:
Тесты памяти:
Я провел memtest86+ на ночь с 10 циклами. Ошибок в памяти нет.

Стресс-тестирование:
Запускал стресс-тесты процессора (stress –cpu 20 –timeout 300) и GPU (FurMark_2.3.0.0_linux64), но система оставалась стабильной во время тестирования и не воспроизводила проблему.

Драйверы и дисплей:
Сначала думал, что проблема может быть связана с MS Teams, но сбои по-прежнему происходят, когда Teams не используется, хотя кажется, что это происходит чаще всего во время звонков в MS Teams. Это не изменяется, если я использую его в браузере (с аппаратным ускорением и без него) или через teams-for-linux / teams-for-linux –disableGpu. Но это также происходит, когда Teams не работает / не в звонке. Когда я использую только браузер, например, при очень низкой нагрузке.

Теперь я подозреваю, что внешний экран, подключенный через HDMI, может быть вовлечен, хотя я этого не подтвердил.

У меня проблемы как с X11, так и с Wayland, используя как драйвер open source nouveau, так и разные версии проприетарных драйверов NVIDIA (nvidia-driver-550, проприетарный, протестированный), но отключения происходят независимо от сочетания.

Обновления системы:
Все пакеты и ядра обновлены. Вся прошивка актуальна.

Обзор журналов:
Проверил /var/log/syslog и /var/log/kern.log, но перед отключениями ничего убедительного не найдено.

Сертификация:
Согласно этому посту (https://ubuntu.com/certified/202306-31718), Lenovo ThinkPad P14s Gen 4 даже сертифицирован для Ubuntu 22.04 LTS. Хотя я использую 24.04 LTS, я предполагаю, что сертификат должен применяться без серьезных проблем.
Ищу помощь:

Я ищу советы или предложения по устранению неполадок, в частности:
Любые потенциальные причины случайных отключений и перезагрузок, особенно связанные с внешними дисплеями или графикой.

Рекомендации по дальнейшей диагностике или журналам файлов, которые могут помочь в выявлении проблемы.
Любые параметры ядра или изменения конфигурации, которые могут стабилизировать систему.
Заранее спасибо за любую помощь!

С наилучшими пожеланиями,
Кетос

x@dexdev:~$ sudo dmesg | grep -i error
[sudo] пароль для x: 
[    1.533738] RAS: Корректируемые ошибки собраны.
[    5.862150] EDAC igen6 MC1: ОБРАБОТКА ОШИБКИ ПАМЯТИ IBECC
[    5.862153] EDAC igen6 MC0: ОБРАБОТКА ОШИБКИ ПАМЯТИ IBECC
x@dexdev:~$ grep -i "error\|fail" /var/log/kern.log
2024-07-24T06:39:35.891513+02:00 dexdev kernel: pci 0000:03:00.0: ROM [mem size 0x00080000 pref]: не удалось назначить
2024-07-24T06:39:35.891712+02:00 dexdev kernel: RAS: Корректируемые ошибки собраны.
2024-07-24T06:39:35.891973+02:00 dexdev kernel: EDAC igen6 MC1: ОБРАБОТКА ОШИБКИ ПАМЯТИ IBECC
2024-07-24T06:39:35.891975+02:00 dexdev kernel: EDAC igen6 MC0: ОБРАБОТКА ОШИБКИ ПАМЯТИ IBECC
2024-07-24T06:39:35.892036+02:00 dexdev kernel: thermal thermal_zone8: не удалось считать тепловую зону (-61)
2024-07-24T06:39:35.892038+02:00 dexdev kernel: Bluetooth: hci0: Не удалось отправить данные прошивки (-71)
2024-07-24T06:39:35.892038+02:00 dexdev kernel: Bluetooth: hci0: отправка кадра не удалась (-19)
2024-07-24T06:39:35.892038+02:00 dexdev kernel: Bluetooth: hci0: восстановление ошибки загрузки прошивки не удалось (-19)
2024-07-24T06:39:35.892039+02:00 dexdev kernel: Bluetooth: hci0: отправка кадра не удалась (-19)
2024-07-24T06:39:35.892039+02:00 dexdev kernel: Bluetooth: hci0: Ошибка при чтении поддерживаемых функций (-19)
2024-07-24T06:39:35.892040+02:00 dexdev kernel: Bluetooth: hci0: Ошибка чтения отладочных функций
2024-07-24T06:39:35.892040+02:00 dexdev kernel: Bluetooth: hci0: отправка кадра не удалась (-19)
2024-07-24T06:39:35.892040+02:00 dexdev kernel: Bluetooth: hci0: Не удалось считать поддерживаемые функции MSFT (-19)
2024-07-24T07:34:04.143778+02:00 dexdev kernel: pci 0000:03:00.0: ROM [mem size 0x00080000 pref]: не удалось назначить
2024-07-24T07:34:04.144218+02:00 dexdev kernel: RAS: Корректируемые ошибки собраны.
2024-07-24T07:34:04.144566+02:00 dexdev kernel: EDAC igen6 MC1: ОБРАБОТКА ОШИБКИ ПАМЯТИ IBECC
2024-07-24T07:34:04.144570+02:00 dexdev kernel: EDAC igen6 MC0: ОБРАБОТКА ОШИБКИ ПАМЯТИ IBECC
2024-07-24T07:34:04.144706+02:00 dexdev kernel: thermal thermal_zone8: не удалось считать тепловую зону (-61)

Случайные отключения питания, которые происходят без ведения журналов, являются классическим симптомом аппаратных неисправностей. Это не функция программного обеспечения (кто бы этого хотел?)

Ubuntu не может правильно работать на ненадежном оборудовании.

Случайные отключения чаще всего вызваны перегревом и выходом из строя блока питания. Существуют и многие другие менее распространенные причины.

У меня такая же проблема с точно таким же выводом dmesg. Я тестировал это на Wayland и X11, как и вы, а также на xfce, unity и MATE на Mint.

Я также сделал тестирование памяти и прошел без ошибок.

Я использую двойную загрузку на этом ПК с Windows 11 и работаю каждый день как основной компьютер без каких-либо перезагрузок или проблем в Windows. Поэтому маловероятно, что это дефектное оборудование, как утверждает комментатор выше.

Еще одно отличие – я сомневаюсь, что это связано с вашей видеокартой, потому что у меня версия с интегрированной графикой Vega.

Ответ или решение

Причины случайных перезагрузок Lenovo ThinkPad P14s Gen 4 под управлением Ubuntu 24.04 LTS

Введение

Случайные перезагрузки и отключения ноутбука Lenovo ThinkPad P14s Gen 4, работающего на Ubuntu 24.04 LTS, могут быть результатом множества факторов, включая ошибки программного обеспечения, проблемы с оборудованием или несовместимые драйвера. В этом ответе мы рассмотрим возможные причины, шаги для диагностики и рекомендации по решению возникшей проблемы.

Описание проблемы

Согласно предоставленной информации, устройство перезагружается без предупреждения и без каких-либо предварительных признаков (заморозки). Ошибки, связанные с HANDLING IBECC MEMORY ERROR, могут указывать на проблемы с памятью, однако тесты на память (memtest86+) не выявили ошибок. Также, наблюдаются проблемы при использовании внешнего дисплея, подключенного через HDMI, что может свидетельствовать о конфликте с графикой.

Возможные причины случайных перезагрузок

  1. Проблемы с перегревом:

    • Неисправности системы охлаждения могут привести к перегреву процессора или графической карты, что вызовет автоматическое отключение для предотвращения повреждений. Проверьте, нет ли грязи в вентиляторах и радиаторах.
  2. Сбой блока питания:

    • Если ноутбук получает недостаточное или нестабильное питание, это может привести к внезапным перезагрузкам. Проверьте адаптер питания и кабели.
  3. Проблемы с драйверами:

    • Использование драйвера nouveau может привести к нестабильности системы. Попробуйте установить наиболее свежую версию проприетарного драйвера NVIDIA. Кроме того, попробуйте отключить аппаратное ускорение в настройках графики.
  4. Конфликт внешнего оборудования:

    • Убедитесь, что подключенные устройства, такие как дисплеи, работают исправно. Попробуйте отключить внешний монитор и проверить, сохраняется ли проблема.
  5. Ошибки BIOS/UEFI:

    • Убедитесь, что BIOS обновлен до последней версии. Иногда проблемы с совместимостью могут быть решены обновлением микропрограммы.
  6. Проблемы с совместимостью программного обеспечения:

    • Некоторые приложения, такие как MS Teams, могут вызывать сбои. Попробуйте временно удалить приложения, которые могут создавать конфликты, и посмотрите, изменится ли ситуация.

Рекомендации по устранению неполадок

  1. Мониторинг температуры:

    • Установите программное обеспечение для мониторинга температуры компонентов (например, lm-sensors) и следите за их состоянием во время работы.
  2. Логи системы:

    • Продолжайте внимательно анализировать системные логи (/var/log/syslog и /var/log/kern.log) и ищите сообщения об ошибках, которые могут предшествовать сбоям.
  3. Ключи загрузки ядра:

    • Попробуйте добавить параметры загрузки ядра, такие как acpi=force, noapic, nomodeset, чтобы отключить некоторые аппаратные функции.
  4. Тестирование с Live USB:

    • Запустите систему с Live USB с Ubuntu и проверьте, возникают ли перезагрузки в этом окружении. Это поможет определить, является ли проблема программной или аппаратной.
  5. Аппаратные тесты:

    • Если проблема сохраняется, может потребоваться провести более глубинную диагностику оборудования, включая проверку состояния SSD и других компонентов.

Заключение

Случайные перезагрузки ноутбука Lenovo ThinkPad P14s Gen 4 могут быть вызваны как программными, так и аппаратными сбоями. Рекомендую внимательно следовать шагам по устранению неполадок, чтобы сузить возможные причины и найти решение. Если проблема не устраняется с помощью описанных выше методов, стоит обратить внимание на возможность обращения в сервисный центр для профессиональной диагностики.

Оцените материал
Добавить комментарий

Капча загружается...