NVIDIA-SMI показывает только один GPU вместо двух.

Вопрос или проблема

У меня есть 2 GPU, но NVIDIA-SMI показывает только одну. Как сделать так, чтобы она распознала другую?

enter image description here

Я думаю, что GPU не отображается, если она отключена. Проверьте, пуст ли файл “remove” в вашем устройстве GPU.
В вашем случае, проверьте следующий файл;
/sys/bus/pci/devices/0000:83:00.0/remove

Если эта папка не существует, значит ваше устройство не запущено корректно. В этом случае, если у вас есть такая возможность, проверьте, что это GPU достаточно питано и правильно подключено.

Если в файле есть 1, измените его на 0 и перезагрузите. Если папка существует, но файл не содержит
значение 1, вы можете проверить другие файлы в этой папке для получения дополнительной информации об устройстве, так как ваше устройство запускается, но существуют другие причины для сбоя. Проверьте, используя другую более старую версию драйвера, как говорит vfbsilva.

Источник: я вручную отключил некоторые GPU, и результаты были аналогичны. https://labernia.wordpress.com/2017/07/16/gpu-testing/

Вы можете добавить несколько GPU, используя следующую команду.

Для запроса информации о GPU

nvidia-xconfig --query-gpu-info

Добавление нескольких GPU


nvidia-xconfig -a --device=Device0 --busid=[PCI Bus ID of GPU #0]
                                  --device=Device1 --busid=[PCI Bus ID of GPU #1]

Перезагрузите систему, чтобы изменения вступили в силу.

Ответ или решение

Проблема, при которой NVIDIA-SMI отображает только один GPU вместо двух, может возникать по ряду причин, связанных с аппаратным обеспечением, конфигурацией системы и программными настройками. Давайте разберем возможные причины и способы их решения.

Теория

В первую очередь, важно понять, как система взаимодействует с графическими процессорами. Когда в системе установлены два и более GPU, система должна корректно распознать и инициировать каждый из них. Это зависит от работы операционной системы, драйверов и аппаратного обеспечения.

  1. Аппаратные проблемы: Вторая видеокарта может не отображаться, если она не установлена или подключена неправильно. Это может быть связано с недостаточным питанием, повреждением слотов PCIe или проблемами с кабелями питания.

  2. Конфигурация BIOS/UEFI: Некоторые системы в BIOS или UEFI могут иметь настройки, которые ограничивают использование дополнительных GPU.

  3. Проблемы с драйверами: Неправильно установленные или устаревшие драйверы могут стать причиной того, что система не распознает один из GPU.

  4. Ограничения ОС: Некоторые операционные системы или их конфигурации могут ограничивать количество одновременно работающих GPU.

Примеры

  1. Проверка подключения: Убедитесь, что обе карты правильно установлены в PCIe слоты и подключены к источнику питания. Недостаток питания может привести к неинициализации устройства.

  2. Проверка конфигурации в BIOS: Некоторые материнские платы имеют настройки, которые отключают дополнительные PCIe слоты. Убедитесь, что все слоты активны.

  3. Проверка файлов системы: Использование командной строки для проверки файлов системы может помочь выявить проблемы с инициализацией оборудования. Например, файл /sys/bus/pci/devices/0000:83:00.0/remove может показать, отключено ли устройство.

  4. Перепроверка драйверов: Убедитесь, что на вашей системе установлена последняя версия драйверов NVIDIA. Поддержка нескольких GPU может отличаться в зависимости от версии драйвера.

Применение

  1. Проверка аппаратного обеспечения:

    • Отключите компьютер и проверьте, все ли кабели и разъемы подключены корректно. Убедитесь в том, что карты надежно установлены в слоты PCIe.
    • Проверьте, выделено ли нужное количество энергии для каждой карты. Используйте специальный калькулятор мощности для проверки, достаточно ли вашей системе энергии для питания всех установленных компонентов.
  2. Проверка конфигурации BIOS/UEFI:

    • Перезагрузите компьютер и войдите в BIOS/UEFI, обычно через нажатие клавиш Del, F2 или другой, в зависимости от модели материнской платы.
    • Найдите настройки, связанные с PCIe или многократной графической поддержкой, и убедитесь, что они активированы.
  3. Проверка и изменения в операционной системе:

    • Проверьте, видят ли операционная система и драйвер вторую видеокарту, через терминал, используя команды:
      lspci | grep NVIDIA

      Это поможет увидеть все устройства NVIDIA, обнаруженные системой.

  4. Команды для исправления конфигурации:

    • Проверьте текущее состояние и параметры устройств:
      nvidia-xconfig --query-gpu-info
    • Исправьте конфигурацию при помощи:
      nvidia-xconfig -a --device=Device0 --busid=[PCI Bus ID of GPU #0] --device=Device1 --busid=[PCI Bus ID of GPU #1]
    • Перезагрузите систему, чтобы изменения вступили в силу.

Эти шаги помогут диагностировать и, возможно, устранить проблему отсутствия второй видеокарты в NVIDIA-SMI. Если проблема сохраняется, возможно потребуется дополнительное тестирование или обращение в службу поддержки по возможной аппаратной неисправности.

Оцените материал
Добавить комментарий

Капча загружается...