- Вопрос или проблема
- Ответ или решение
- Проблемы с установкой драйвера для NVIDIA Tesla K80 под Linux: Расширенное руководство
- 1. Убедитесь в совместимости оборудования
- 2. Установка зависимостей и черный список драйвера Nouveau
- 3. Проверьте наличие конфликтующих драйверов
- 4. Установка драйверов с использованием PPA или .run файла
- 5. Проверка состояния после установки
- 6. Проверка совместимости версий
- Заключение
Вопрос или проблема
Я пытался установить драйвер для K80 под Ubuntu в течение 1 недели, и мне не удалось установить его успешно, хотя я пробовал каждый метод с форума NVIDIA/Google.
Когда я использую lspci, появляется следующее:
04:00.0 3D контроллер: NVIDIA Corporation Device 102d (rev a1)
05:00.0 3D контроллер: NVIDIA Corporation Device 102d (rev a1)
1. Материнская плата, которую я использую, – ASRock Fatal1ty Z97X Killer, которая поддерживает PCI-e 3.0 x 16. Может ли это быть проблемой?
http://www.asrock.com/mb/Intel/Fatal1ty%20Z97X%20Killer/
2. Каждый раз, когда я хочу установить драйвер для Tesla K80, появляется следующая информация:
a) скрипт предварительной установки, предоставленный дистрибутивом, завершился неудачей
b) ОШИБКА: Не удается загрузить модуль ядра ‘nvidia.ko’. Это чаще всего происходит, когда этот модуль ядра был построен против неправильных или неправильно настроенных исходных кодов ядра, с версией gcc, которая отличается от той, что использовалась для сборки целевого ядра, или если присутствует драйвер, такой как rivafb, nvidiafb или nouveau, который мешает модулю ядра NVIDIA получить владение графическими устройствами NVIDIA, или если в этой системе не установлено поддерживаемое графическое устройство NVIDIA.
Я пробовал разные версии Ubuntu (12.04/14.04), это все равно не сработало.
Может кто-нибудь объяснить, в чем проблема и как я могу это исправить, чтобы наконец установить драйверы?
Спасибо,
Jiawen
Основываясь на вашей информации
a) скрипт предварительной установки, предоставленный дистрибутивом, завершился неудачей
Я предполагаю, что вы пытались установить драйвер из *.run файла, загруженного с nvidia.com. Вы пробовали установить драйверы из ppa?
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update && sudo apt-get install nvidia-352
Где nvidia-352 – это длинный драйвер с поддержкой Tesla и Quadro систем.
Если вам по какой-то причине необходимо установить драйверы со страницы nvidia, вам следует сначала убедиться, что вы добавили nouveau в черный список:
sudo vim /etc/modprobe.d/blacklist.conf
Добавьте следующие строки:
blacklist amd76x_edac
blacklist vga16fb
blacklist nouveau
blacklist rivafb
blacklist nvidiafb
blacklist rivatv
Если у вас недавно был установлен nvidia из ppa, выполните полную очистку:
sudo apt-get remove --purge nvidia*
sudo reboot
После перезагрузки попробуйте снова установить драйверы nvidia:
Нажмите Ctrl+Alt+F1, чтобы перейти в текстовый режим и войти в систему
sudo service lightdm stop
sudo /path/to/nvidia*.*.run
Ответ или решение
Проблемы с установкой драйвера для NVIDIA Tesla K80 под Linux: Расширенное руководство
Для устранения проблем с установкой драйвера NVIDIA Tesla K80 на Ubuntu, как уже было упомянуто в вашем вопросе, следует учесть несколько критически важных моментов. Давайте разберём этапы диагностики и решения, основываясь на представленной информации.
1. Убедитесь в совместимости оборудования
Как вы указали, ваша материнская плата ASRock Fatal1ty Z97X Killer поддерживает PCI-e 3.0 x 16. Это должно работать корректно для установки Tesla K80, так как видеокарта должна быть обратно совместима с PCI-e 2.0 и 3.0. Тем не менее, добавьте проверки:
- Убедитесь, что видеокарта установлена в соответствующий слот PCI-e.
- Проверьте, требуется ли дополнительное питание для вашей карты, и подключено ли оно.
2. Установка зависимостей и черный список драйвера Nouveau
NVIDIA требует, чтобы драйвер Nouveau, который является открытым драйвером для карт NVIDIA, был отключен перед установкой проприетарного драйвера. Выполните следующие команды, чтобы заблокировать Nouveau:
sudo vim /etc/modprobe.d/blacklist.conf
Добавьте следующие строки:
blacklist nouveau
options nouveau modeset=0
Затем выполните:
sudo update-initramfs -u
sudo reboot
3. Проверьте наличие конфликтующих драйверов
Если драйвер NVIDIA был ранее установлен из репозитория Ubuntu или с помощью .run файла, рекомендуется удалить его полностью:
sudo apt-get remove --purge nvidia*
Или, если у вас есть установленные зависимости:
sudo apt-get remove --purge '^nvidia-.*'
4. Установка драйверов с использованием PPA или .run файла
Вы можете попробовать установку драйверов через PPA. Выполните следующие команды:
sudo add-apt-repository ppa:graphics-drivers/ppa
sudo apt-get update
sudo apt-get install nvidia-350 # или nvidia-390 для более новых версий
Альтернативно, если вы предпочитаете установку напрямую с сайта NVIDIA:
- Скачайте драйвер с официального сайта NVIDIA.
- Перейдите в текстовый режим:
sudo systemctl isolate multi-user.target # Для перехода в текстовый режим
- Остановите графический интерфейс:
sudo service lightdm stop # или gdm, в зависимости от дистрибутива
- Установите драйвер:
sudo sh /path/to/NVIDIA-Linux-x86_64-*.run
5. Проверка состояния после установки
После завершения установки перезагрузите систему:
sudo reboot
После перезагрузки можно проверить статус установки драйвера:
nvidia-smi
Эта команда должна отобразить информацию о драйвере и GPU.
6. Проверка совместимости версий
Убедитесь, что версии ядра Linux и gcc соответствуют тому, что требуется для сборки драйвера:
- Проверьте, какое ядро используется:
uname -r
- Убедитесь, что gcc соответствует:
gcc --version
Если версии различаются, необходимо установить версии, совместимые с вашим ядром.
Заключение
Если перечисленные шаги не приведут к успешной установке драйвера, возможно, потребуется обратиться за помощью к сообществу или на форум NVIDIA с более подробной информацией о вашей системе и выдаваемых ошибках. Будьте внимательны к сообщениям об ошибках при установке и всегда следуйте документации на сайте NVIDIA для получения самой актуальной информации.