Проблемы с установкой CUDA и cuDNN на Ubuntu 24.04

Вопрос или проблема

В настоящее время я использую Ubuntu 24.04 и столкнулся с несколькими проблемами при попытке установить драйверы CUDA и cuDNN. Несмотря на следование инструкциям по установке, у меня возникают проблемы. Кроме того, после установки мой внешний монитор больше не определяется.

Ниже приведен мой установленный драйвер NVIDIA по умолчанию.

вставьте описание изображения здесь

 +---------------------------------------------------------------------------------------+

| NVIDIA-SMI 535.183.01 Версия драйвера: 535.183.01 Версия CUDA: 12.2 |

|-----------------------------------------+----------------------+----------------------+

| Имя GPU Персистентный режим | Bus-Id Disp.A | Нестабильная некорр. ECC |

| Вентилятор Темп Производительность Потребление:Использование/Возможности | Использование памяти | Использование GPU Режим вычислений. |

| | | MIG M. |

|=========================================+======================+======================|

| 0 NVIDIA GeForce RTX 3070 ... Отключено | 00000000:01:00.0 Отключено | Н/Д |

| Н/Д 46C P0 25W / 80W | 8MiB / 8192MiB | 0% По умолчанию |

| | | Н/Д |

+-----------------------------------------+----------------------+----------------------+ 

Похоже, что CUDA установлена, но когда я запускаю это

import tensorflow as tf
from tensorflow.python.compiler.tensorrt import trt_convert as trt
print("TensorFlow собран с CUDA:", tf.test.is_built_with_cuda())
print("Доступно устройств GPU:", len(tf.config.experimental.list_physical_devices('GPU')))

Это возвращает 0 GPUs.

Как ранее пользователь Ubuntu 20.04 и 22.04, я рад 24.04. На мой взгляд, благодаря текущему ажиотажу вокруг ИИ, NVIDIA наконец-то нашла общий язык с пользователями Linux. Дело в том, что в предыдущих версиях мне требовался минимум день, чтобы использовать CUDNN, а здесь в 24.04 я просто выполнил эти шаги, и все готово!

Но сначала нужно упомянуть, что,

  • Мой ноутбук – Lenovo Thinkpad с графическим процессором PRX Quadro A4500.
  • Я не позволил Ubuntu найти драйвер и загрузить его через مركز приложений.

Шаги следующие:

  1. Скачайте драйвер deb из дата-центра, выбрав свой GPU:
    https://developer.nvidia.com/datacenter-driver-downloads

  2. Установите драйвер, следуя инструкциям на странице загрузки:
    Для моего GPU это были инструкции для справки:

     wget https://developer.download.nvidia.com/compute/nvidia-driver/565.57.01/local_installers/nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb
    
     sudo dpkg -i nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb
    
     sudo cp /var/nvidia-driver-local-repo-ubuntu2404-565.57.01/nvidia-driver-*-keyring.gpg /usr/share/keyrings/
    
     sudo apt-get update
    
  3. На этом этапе мы можем автоматически установить CUDA также с помощью этого:

    sudo apt-get install -y cuda-drivers-565
    

Вы можете проверить вашу установку из bash, используя это:

nvidia-smi

Вы должны увидеть что-то подобное с деталями драйвера в верхнем левом углу и версией CUDA в верхнем правом углу:
скриншот nvidia-smi - cuda

  1. Теперь нам лишь нужно установить CUDNN :
    https://developer.nvidia.com/cudnn-downloads

     wget https://developer.download.nvidia.com/compute/cudnn/9.5.1/local_installers/cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb
    
     sudo dpkg -i cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb
    
     sudo cp /var/cudnn-local-repo-ubuntu2404-9.5.1/cudnn-*-keyring.gpg /usr/share/keyrings/
    
     sudo apt-get update
    
     sudo apt-get -y install cudnn
    
  2. После этих установок я протестировал это в Jupyter Notebook с помощью этих команд:

    !pip install torch
    
    import torch
    
    if torch.cuda.is_available():
    
       print("CUDA доступна! PyTorch может использовать GPU.")
       print(f"Количество устройств: {torch.cuda.device_count()}")
       print(f"Имя устройства: {torch.cuda.get_device_name(0)}")
    else:
    
       print("CUDA недоступна. PyTorch не может использовать GPU.")
    

И вы должны увидеть следующий ответ :

CUDA доступна! PyTorch может использовать GPU.

Количество устройств: 1

Имя устройства: NVIDIA RTX A4500 Laptop GPU

Надеюсь, это поможет!

Ответ или решение

Проблемы с установкой CUDA и cuDNN на Ubuntu 24.04

Если вы столкнулись с трудностями при установке CUDA и cuDNN на Ubuntu 24.04, а также с проблемами обнаружения внешнего монитора, вы не одиноки. Данная статья рассмотрит основные шаги по установке и решению потенциальных проблем.

1. Проверка совместимости драйвера

Сначала убедитесь, что установленный драйвер NVIDIA совместим с вашей видеокартой. В вашем случае у вас установлена версия драйвера 535.183.01, которая совместима с CUDA 12.2. Однако стоит проверить, требуется ли установить более свежую версию драйвера.

nvidia-smi

2. Установка CUDA

Для установки CUDA следует выполнить следующие шаги:

  1. Скачайте драйвер для вашей видеокарты с официального сайта NVIDIA:

    wget https://developer.download.nvidia.com/compute/nvidia-driver/565.57.01/local_installers/nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb
  2. Установите драйвер:

    sudo dpkg -i nvidia-driver-local-repo-ubuntu2404-565.57.01_1.0-1_amd64.deb
    sudo cp /var/nvidia-driver-local-repo-ubuntu2404-565.57.01/nvidia-driver-*-keyring.gpg /usr/share/keyrings/
    sudo apt-get update
  3. Установите CUDA:

    sudo apt-get install -y cuda-drivers-565
  4. Проверьте установку CUDA:

    nvidia-smi

    Вы должны увидеть информацию о версии драйвера и версии CUDA.

3. Установка cuDNN

Для установки cuDNN выполните следующие шаги:

  1. Скачайте cuDNN с официального сайта:

    wget https://developer.download.nvidia.com/compute/cudnn/9.5.1/local_installers/cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb
  2. Установите cuDNN:

    sudo dpkg -i cudnn-local-repo-ubuntu2404-9.5.1_1.0-1_amd64.deb
    sudo cp /var/cudnn-local-repo-ubuntu2404-9.5.1/cudnn-*-keyring.gpg /usr/share/keyrings/
    sudo apt-get update
    sudo apt-get -y install cudnn

4. Проверка установки TensorFlow

После установки CUDA и cuDNN проверьте совместимость TensorFlow с CUDA:

import tensorflow as tf
print("TensorFlow built with CUDA:", tf.test.is_built_with_cuda())
print("Num GPUs Available:", len(tf.config.experimental.list_physical_devices('GPU')))

Если возникает сообщение о том, что GPU не обнаружен, это может быть связано с несколькими проблемами:

  • Будьте уверены, что TensorFlow установлен с поддержкой CUDA. Установите его, выполнив:

    pip install tensorflow
  • Проверьте, активированы ли GPU в BIOS вашего устройства.

5. Решение проблем с внешним монитором

Если внешний монитор перестал обнаруживаться после установки драйвера, попробуйте следующие шаги:

  1. Перезапустите систему после установки драйверов. Это может помочь переинициализировать графическую подсистему.

  2. Проверьте настройки дисплея в Настройки > Дисплеи и убедитесь, что ваш внешний монитор выбран и активен.

  3. Установите дополнительные пакеты, если они недоступны:

    sudo apt install nvidia-settings

Заключение

Установка CUDA и cuDNN на Ubuntu 24.04 может быть непростой задачей, но следуя вышеизложенным шагам и проверяя совместимость компонентов, вы сможете успешно настроить вашу систему. Убедитесь, что все драйвера правильно установлены и пройдите дополнительные проверки, чтобы гарантировать корректную работу с графическими процессорами. Если проблемы продолжают возникать, рекомендуется обратиться к сообществу или официальной документации NVIDIA для получения дополнительной помощи.

Оцените материал
Добавить комментарий

Капча загружается...