NVIDIA-SMI не удалось, потому что он не смог установить связь с драйвером NVIDIA в Ubuntu 18.04.

Вопрос или проблема

NVIDIA-SMI не удалось выполнить, так как он не смог установить связь с драйвером NVIDIA. Убедитесь, что установлен и запущен последний драйвер NVIDIA. & Я пытался вручную установить, как предлагали другие ответы, и ничего не работает. Я несколько раз удалял и переустанавливал последний, а также другие версии драйверов.

Проверьте, отключен ли Secure Boot в BIOS.

Это произошло, когда обновление Ubuntu каким-то образом испортило драйвер Nvidia во время обновления ядра до 6.1.0-1015-oem (Ubuntu 22.04). Мне пришлось выполнить эти шаги, чтобы восстановить драйвер nvidia.

  • sudo apt-get remove --purge '^nvidia-.*'
  • sudo apt-get remove --purge '^libnvidia-.*'
  • sudo apt-get remove --purge '^cuda-.*'
  • sudo apt-get install linux-headers-$(uname -r)
  • Проверьте последний рекомендованный драйвер, используя ubuntu-drivers devices (у меня был nvidia-driver-535)
  • Установите последний рекомендованный драйвер sudo apt install nvidia-driver-535
  • Перезагрузитесь и выполните nvidia-smi, чтобы убедиться, что все работает
  • (По желанию) Переключитесь в режим производительности Nvidia и перезагрузитесь

Ссылка:
https://forums.developer.nvidia.com/t/nvidia-smi-has-failed-because-it-couldnt-communicate-with-the-nvidia-driver-make-sure-that-the-latest-nvidia-driver-is-installed-and-running/197141/6?u=abdulraufmujahid

В моем случае повторная установка, отключение Secure Boot, ни prime-select, ни перезагрузка не помогают.

Мне нужно установить пакет nvidia-dkms через sudo apt install nvidia-dkms-YOUR-VERSION, который отсутствует в рекомендованном методе установки в официальной документации (https://ubuntu.com/server/docs/nvidia-drivers-installation). Пакет nvidia-dkms упоминается только в методе ручной установки.

Ответ или решение

Решение проблемы с NVIDIA-SMI в Ubuntu 18.04

Ошибка "NVIDIA-SMI has failed because it couldn’t communicate with the NVIDIA driver" в Ubuntu 18.04 может возникнуть по нескольким причинам, большинство из которых связано с драйверами NVIDIA и их взаимодействием с ядром операционной системы. Ниже представлено пошаговое руководство о том, как устранить эту проблему:

1. Проверка установки драйвера NVIDIA

Прежде всего, убедитесь, что последний драйвер NVIDIA установлен и работает корректно. Если вы уже пытались переустановить драйвер, следуйте этим рекомендациям:

  • Откройте терминал и выполните следующие команды для полного удаления существующих пакетов NVIDIA:
    sudo apt-get remove --purge '^nvidia-.*'
    sudo apt-get remove --purge '^libnvidia-.*'
    sudo apt-get remove --purge '^cuda-.*'
  • Установите заголовки ядра, которые необходимы для сборки модулей:
    sudo apt-get install linux-headers-$(uname -r)

2. Определение и установка рекомендуемого драйвера

Чтобы обнаружить рекомендуемый драйвер, выполните команду:

ubuntu-drivers devices

Это выведет список доступных драйверов. Установите рекомендованный драйвер, например, nvidia-driver-535:

sudo apt install nvidia-driver-535

3. Установка nvidia-dkms

Если стандартная установка драйвера не дала результатов, попробуйте установить пакет nvidia-dkms, который может отсутствовать в автоматических установках:

sudo apt install nvidia-dkms-535

Это пакет, который отвечает за сборку драйвера для вашего текущего ядра.

4. Отключение Secure Boot

Убедитесь, что функция Secure Boot отключена в BIOS. Эта настройка может блокировать загрузку драйверов, необходимых для работы с NVIDIA. Перезагрузитесь, войдите в BIOS и отключите Secure Boot, если он включен.

5. Перезагрузка системы

После выполнения всех вышеуказанных шагов перезагрузите систему:

sudo reboot

6. Проверка работы NVIDIA-SMI

После перезагрузки проверьте, решена ли проблема, выполнив команду:

nvidia-smi

Если все сделано правильно, вы увидите информацию о вашей графической карте NVIDIA и ее текущем состоянии.

7. Дополнительные шаги

Если ошибка все еще возникает, вам может понадобиться:

  • Переключиться на режим производительности NVIDIA с помощью prime-select (для систем с Hybrid Graphics):
    sudo prime-select nvidia
  • Убедитесь также, что не осталось старых версий драйверов, которые могут конфликтовать с новыми установками.

Заключение

Если после выполнения всех этих действий проблема все еще не решена, возможно, присутствуют аппаратные или совместимые проблемы с вашей графической картой. В таком случае рекомендуется обратиться к форумам поддержки NVIDIA или в сообщество Ubuntu для более детального анализа вашей конфигурации.

Оцените материал
Добавить комментарий

Капча загружается...