Вопрос или проблема
В настоящее время я использую Ubuntu 24.04 и столкнулся с несколькими проблемами при попытке установить драйверы CUDA и cuDNN. Несмотря на следование инструкциям по установке, у меня возникают проблемы. Кроме того, после установки мой внешний монитор больше не определяется.
Ниже приведен мой установленный драйвер NVIDIA по умолчанию.
+---------------------------------------------------------------------------------------+
| NVIDIA-SMI 535.183.01 Версия драйвера: 535.183.01 Версия CUDA: 12.2 |
|-----------------------------------------+----------------------+----------------------+
| Имя GPU Персистентный режим | Bus-Id Disp.A | Нестабильная некорр. ECC |
| Вентилятор Темп Производительность Потребление:Использование/Возможности | Использование памяти | Использование GPU Режим вычислений. |
| | | MIG M. |
|=========================================+======================+======================|
| 0 NVIDIA GeForce RTX 3070 ... Отключено | 00000000:01:00.0 Отключено | Н/Д |
| Н/Д 46C P0 25W / 80W | 8MiB / 8192MiB | 0% По умолчанию |
| | | Н/Д |
+-----------------------------------------+----------------------+----------------------+
Похоже, что CUDA установлена, но когда я запускаю это
import tensorflow as tf
from tensorflow.python.compiler.tensorrt import trt_convert as trt
print("TensorFlow собран с CUDA:", tf.test.is_built_with_cuda())
print("Доступно устройств GPU:", len(tf.config.experimental.list_physical_devices('GPU')))
Это возвращает 0 GPUs.
Как ранее пользователь Ubuntu 20.04 и 22.04, я рад 24.04. На мой взгляд, благодаря текущему ажиотажу вокруг ИИ, NVIDIA наконец-то нашла общий язык с пользователями Linux. Дело в том, что в предыдущих версиях мне требовался минимум день, чтобы использовать CUDNN, а здесь в 24.04 я просто выполнил эти шаги, и все готово!
Но сначала нужно упомянуть, что,
- Мой ноутбук – Lenovo Thinkpad с графическим процессором PRX Quadro A4500.
- Я не позволил Ubuntu найти драйвер и загрузить его через مركز приложений.
Шаги следующие:
-
Скачайте драйвер deb из дата-центра, выбрав свой GPU:
https://developer.nvidia.com/datacenter-driver-downloads -
Установите драйвер, следуя инструкциям на странице загрузки:
Для моего GPU это были инструкции для справки:wget https://developer.download.nvidia.com/compute/nvidia-driver/565.57.01/local_installers/nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb sudo dpkg -i nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb sudo cp /var/nvidia-driver-local-repo-ubuntu2404-565.57.01/nvidia-driver-*-keyring.gpg /usr/share/keyrings/ sudo apt-get update
-
На этом этапе мы можем автоматически установить CUDA также с помощью этого:
sudo apt-get install -y cuda-drivers-565
Вы можете проверить вашу установку из bash, используя это:
nvidia-smi
Вы должны увидеть что-то подобное с деталями драйвера в верхнем левом углу и версией CUDA в верхнем правом углу:
-
Теперь нам лишь нужно установить CUDNN :
https://developer.nvidia.com/cudnn-downloadswget https://developer.download.nvidia.com/compute/cudnn/9.5.1/local_installers/cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb sudo dpkg -i cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb sudo cp /var/cudnn-local-repo-ubuntu2404-9.5.1/cudnn-*-keyring.gpg /usr/share/keyrings/ sudo apt-get update sudo apt-get -y install cudnn
-
После этих установок я протестировал это в Jupyter Notebook с помощью этих команд:
!pip install torch import torch if torch.cuda.is_available(): print("CUDA доступна! PyTorch может использовать GPU.") print(f"Количество устройств: {torch.cuda.device_count()}") print(f"Имя устройства: {torch.cuda.get_device_name(0)}") else: print("CUDA недоступна. PyTorch не может использовать GPU.")
И вы должны увидеть следующий ответ :
CUDA доступна! PyTorch может использовать GPU.
Количество устройств: 1
Имя устройства: NVIDIA RTX A4500 Laptop GPU
Надеюсь, это поможет!
Ответ или решение
Проблемы с установкой CUDA и cuDNN на Ubuntu 24.04
Если вы столкнулись с трудностями при установке CUDA и cuDNN на Ubuntu 24.04, а также с проблемами обнаружения внешнего монитора, вы не одиноки. Данная статья рассмотрит основные шаги по установке и решению потенциальных проблем.
1. Проверка совместимости драйвера
Сначала убедитесь, что установленный драйвер NVIDIA совместим с вашей видеокартой. В вашем случае у вас установлена версия драйвера 535.183.01, которая совместима с CUDA 12.2. Однако стоит проверить, требуется ли установить более свежую версию драйвера.
nvidia-smi
2. Установка CUDA
Для установки CUDA следует выполнить следующие шаги:
-
Скачайте драйвер для вашей видеокарты с официального сайта NVIDIA:
wget https://developer.download.nvidia.com/compute/nvidia-driver/565.57.01/local_installers/nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb
-
Установите драйвер:
sudo dpkg -i nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb sudo cp /var/nvidia-driver-local-repo-ubuntu2404-565.57.01/nvidia-driver-*-keyring.gpg /usr/share/keyrings/ sudo apt-get update
-
Установите CUDA:
sudo apt-get install -y cuda-drivers-565
-
Проверьте установку CUDA:
nvidia-smi
Вы должны увидеть информацию о версии драйвера и версии CUDA.
3. Установка cuDNN
Для установки cuDNN выполните следующие шаги:
-
Скачайте cuDNN с официального сайта:
wget https://developer.download.nvidia.com/compute/cudnn/9.5.1/local_installers/cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb
-
Установите cuDNN:
sudo dpkg -i cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb sudo cp /var/cudnn-local-repo-ubuntu2404-9.5.1/cudnn-*-keyring.gpg /usr/share/keyrings/ sudo apt-get update sudo apt-get -y install cudnn
4. Проверка установки TensorFlow
После установки CUDA и cuDNN проверьте совместимость TensorFlow с CUDA:
import tensorflow as tf
print("TensorFlow built with CUDA:", tf.test.is_built_with_cuda())
print("Num GPUs Available:", len(tf.config.experimental.list_physical_devices('GPU')))
Если возникает сообщение о том, что GPU не обнаружен, это может быть связано с несколькими проблемами:
-
Будьте уверены, что TensorFlow установлен с поддержкой CUDA. Установите его, выполнив:
pip install tensorflow
-
Проверьте, активированы ли GPU в BIOS вашего устройства.
5. Решение проблем с внешним монитором
Если внешний монитор перестал обнаруживаться после установки драйвера, попробуйте следующие шаги:
-
Перезапустите систему после установки драйверов. Это может помочь переинициализировать графическую подсистему.
-
Проверьте настройки дисплея в
Настройки > Дисплеи
и убедитесь, что ваш внешний монитор выбран и активен. -
Установите дополнительные пакеты, если они недоступны:
sudo apt install nvidia-settings
Заключение
Установка CUDA и cuDNN на Ubuntu 24.04 может быть непростой задачей, но следуя вышеизложенным шагам и проверяя совместимость компонентов, вы сможете успешно настроить вашу систему. Убедитесь, что все драйвера правильно установлены и пройдите дополнительные проверки, чтобы гарантировать корректную работу с графическими процессорами. Если проблемы продолжают возникать, рекомендуется обратиться к сообществу или официальной документации NVIDIA для получения дополнительной помощи.