Случайные полные сбои систем и зависания. Я пытался заменить некоторые аппаратные компоненты, но ничего не изменилось. Что ещё мне стоит проверить?

Вопрос или проблема

На Ubuntu 24.04 LTS (ядро 6.8), с тех пор как я начал его использовать, происходят случайные сбои системы. Не имеет значения, что я делаю или как долго компьютер включен, в какой-то момент всё зависает, мышь перестает двигаться, любая комбинация нажатий клавиш не реагирует, звук отключается, и я не могу подключиться к ПК по SSH. Полный сбой. На Windows этого не происходит, никогда не происходило и не возникает синего экрана смерти. У меня была та же проблема и раньше с разными версиями Ubuntu и ядра (даже в PopOs), и я никогда не удалось ее решить.

Аппаратное обеспечение:

  • ЦП: Ryzen 5 1600X
  • ГП: Nvidia 1050Ti / Radeon RX 6800
  • Материнская плата: Asrock AB350 Pro4

Подозреваемый GNOME

Я попробовал использовать KDE Plasma вместо GNOME, но проблема сохраняется.

Подозреваемая графическая карта

Я попробовал загрузить систему без видеокарты, и при подключении по SSH сбоев не происходит. Я подумал, что это может быть из-за графической карты, поэтому установил новую видеокарту Radeon 6800, но проблема сохраняется. Не думаю, что это проблема видеокарты Nvidia.

Подозреваемый SSD

Запуск Ubuntu в живом режиме с USB-накопителя вызывает ту же проблему. Данные SMART с SSD не показывают проблем.

Подозреваемая ОЗУ

Я поочередно протестировал две планки ОЗУ по 8 ГБ (GSkill F4-3200C16D-16GTZSK), система зависает с обеими планками. Windows, с другой стороны, не вызывает проблем, а MemTest86 не показывает ошибок. Сомневаюсь, что это проблема аппаратного обеспечения ОЗУ. Попробовав планку из другого компьютера (Crucial RAM 8GB DDR4 3200MHz), сбоя не происходит.

Во всех тестах BIOS был обновлен, а XMP отключен. Что еще я мог бы попробовать, чтобы выяснить причину проблемы?

Проблема, похоже, связана с ядром 6.8 или более поздними версиями, или драйверами Mesa (возможно, vulkan).

  • У меня та же проблема, что и у вас, и я тестировал эту проблему на 2 разных системах Intel 13-го поколения.
  • Сначала я думал, что это из-за Ubuntu, поэтому я установил PopOS (проблема ухудшилась, ядро PopOS – 6.9)
  • Затем я подумал, что дело в расширениях gnome и заменил их (но это не решило проблему)
  • Затем я установил KDE и заметил, что проблема сохраняется!
  • Я даже заметил ту же проблему в живой версии Ubuntu, и она зависла несколько раз!
  • Я протестировал как Wayland, так и x11, и проблема не была решена.

Я не видел этой проблемы в Zorin OS, потому что она использует ядро 6.5 (я проверял) или более старые драйвера mesa (я не проверял).

Поэтому я удалил драйвера mesa из Ubuntu, и система стала стабильной, но у нее нет должной графической мощности.

Я все еще пытаюсь выяснить точную причину проблемы.

Проблема связана с ядром 6.8, поверьте мне, я думал, что потерял свой ноутбук Lenovo, пока не установил предыдущую LTS версию Ubuntu с ядром 5, и теперь ноутбук снова работает. Мой ноутбук просто полностью завис и перегрелся, что-то безумное.

Ответ или решение

Анализ случайных зависаний системы Ubuntu 24.04 LTS

Если у вас случаются случайные заморозки и полные сбои системы под управлением Ubuntu 24.04 LTS (ядро 6.8), стоит провести детальный анализ возможных причин и путей решения проблемы. Рассмотрим все аспекты.

1. Обновление и совместимость ядра

Поскольку проблема наблюдается на нескольких версиях Ubuntu и других дистрибутивах (включая Pop!_OS с ядром 6.9), первое, что стоит проверить — это совместимость выбранного ядра с вашим оборудованием.

  • Попробуйте установить более старую версию ядра, например, 5.15 или 5.19, которые, как вы уже видели, могут вести себя более стабильно. Для этого в меню загрузки Grub нажмите Shift для доступа к меню и выберите “Advanced options for Ubuntu”, затем выберите старую версию ядра.

2. Проблемы с драйверами графической подсистемы

Вы упомянули, что пробовали разные видеокарты и установки драйверов. Если подозреваются проблемы с Mesa или драйверами для вашей видеокарты (независимо от того, используете ли вы Radeon или NVIDIA), рекомендуется:

  • Удалить текущие драйверы и установить их заново, использовав PPA-репозитории, такие как oibaf, которые содержат обновлённые версии Mesa. Это возможно улучшит совместимость и производительность.
  • Проверьте использование Vulkan: если вы используете приложения на базе Vulkan, попробуйте отключить их или перейти на OpenGL.

3. Проверка оперативной памяти

Несмотря на то, что MemTest86 не выявил ошибок, стоит рассмотреть возможность несовместимости ваших модулей памяти. Возможно, стоит проверить следующие аспекты:

  • Тестирование в других слотах материнской платы: иногда проблема заключается в самом слоте, а не в модуле ОЗУ.
  • Настройки BIOS: системы на базе Ryzen иногда могут быть чувствительны к настройкам XMP. Попробуйте отключить XMP и поэкспериментируйте с частотой памяти.

4. Проверка SSD

Хотя SMART результаты вашего SSD стабильны, возможно стоит выполнить следующие действия:

  • Проверьте файловую систему: используйте fsck для выявления и устранения ошибок файловой системы. Это можно сделать с помощью живого USB (live USB) дистрибутива.
  • Проверьте наличие обновлений прошивки: для SSD могут быть доступны прошивки, которые устраняют известные недочеты и улучшают стабильность работы.

5. Дополнительные проверки системы

  • Лог-файлы системы: изучите файлы логов /var/log/syslog, /var/log/dmesg и journalctl -xe на предмет ошибок, которые могут давать подсказки о причинах сбоев.
  • Отключение ненужных процессов: попробуйте отключить ненужные фоновые процессы и сервисы, которые могут быть причиной перегрузки системы.

6. Окончательная инсталляция

Если проблемы продолжают возникать, возможно стоит попробовать:

  • Чистую установку Ubuntu: иногда лучше всего начать с нуля, используя только необходимое программное обеспечение и активно контролируя установку драйверов и приложений.
  • Альтернативная ОС: если ни один из вариантов не помогает, возможно вам стоит рассмотреть использование более старого дистрибутива, как Zorin OS, который вы упомянули как стабильный.

Заключение

Разобраться с проблемой, связанной с зависанием системы, может быть непросто. Однако методический подход и жесткая проверка всех компонентов — от аппаратного до программного обеспечения — могут помочь в выявлении и устранении неисправностей. Внимательно следите за изменениями после каждой настройки и документируйте результаты, чтобы вы могли оценить, что действительно влияет на стабильность операционной системы.

Оцените материал
Добавить комментарий

Капча загружается...