Вопрос или проблема
У меня есть 2 GPU, но NVIDIA-SMI показывает только одну. Как сделать так, чтобы она распознала другую?
Я думаю, что GPU не отображается, если она отключена. Проверьте, пуст ли файл “remove” в вашем устройстве GPU.
В вашем случае, проверьте следующий файл;
/sys/bus/pci/devices/0000:83:00.0/remove
Если эта папка не существует, значит ваше устройство не запущено корректно. В этом случае, если у вас есть такая возможность, проверьте, что это GPU достаточно питано и правильно подключено.
Если в файле есть 1, измените его на 0 и перезагрузите. Если папка существует, но файл не содержит
значение 1, вы можете проверить другие файлы в этой папке для получения дополнительной информации об устройстве, так как ваше устройство запускается, но существуют другие причины для сбоя. Проверьте, используя другую более старую версию драйвера, как говорит vfbsilva.
Источник: я вручную отключил некоторые GPU, и результаты были аналогичны. https://labernia.wordpress.com/2017/07/16/gpu-testing/
Вы можете добавить несколько GPU, используя следующую команду.
Для запроса информации о GPU
nvidia-xconfig --query-gpu-info
Добавление нескольких GPU
nvidia-xconfig -a --device=Device0 --busid=[PCI Bus ID of GPU #0] --device=Device1 --busid=[PCI Bus ID of GPU #1]
Перезагрузите систему, чтобы изменения вступили в силу.
Ответ или решение
Проблема, при которой NVIDIA-SMI
отображает только один GPU вместо двух, может возникать по ряду причин, связанных с аппаратным обеспечением, конфигурацией системы и программными настройками. Давайте разберем возможные причины и способы их решения.
Теория
В первую очередь, важно понять, как система взаимодействует с графическими процессорами. Когда в системе установлены два и более GPU, система должна корректно распознать и инициировать каждый из них. Это зависит от работы операционной системы, драйверов и аппаратного обеспечения.
-
Аппаратные проблемы: Вторая видеокарта может не отображаться, если она не установлена или подключена неправильно. Это может быть связано с недостаточным питанием, повреждением слотов PCIe или проблемами с кабелями питания.
-
Конфигурация BIOS/UEFI: Некоторые системы в BIOS или UEFI могут иметь настройки, которые ограничивают использование дополнительных GPU.
-
Проблемы с драйверами: Неправильно установленные или устаревшие драйверы могут стать причиной того, что система не распознает один из GPU.
-
Ограничения ОС: Некоторые операционные системы или их конфигурации могут ограничивать количество одновременно работающих GPU.
Примеры
-
Проверка подключения: Убедитесь, что обе карты правильно установлены в PCIe слоты и подключены к источнику питания. Недостаток питания может привести к неинициализации устройства.
-
Проверка конфигурации в BIOS: Некоторые материнские платы имеют настройки, которые отключают дополнительные PCIe слоты. Убедитесь, что все слоты активны.
-
Проверка файлов системы: Использование командной строки для проверки файлов системы может помочь выявить проблемы с инициализацией оборудования. Например, файл
/sys/bus/pci/devices/0000:83:00.0/remove
может показать, отключено ли устройство. -
Перепроверка драйверов: Убедитесь, что на вашей системе установлена последняя версия драйверов NVIDIA. Поддержка нескольких GPU может отличаться в зависимости от версии драйвера.
Применение
-
Проверка аппаратного обеспечения:
- Отключите компьютер и проверьте, все ли кабели и разъемы подключены корректно. Убедитесь в том, что карты надежно установлены в слоты PCIe.
- Проверьте, выделено ли нужное количество энергии для каждой карты. Используйте специальный калькулятор мощности для проверки, достаточно ли вашей системе энергии для питания всех установленных компонентов.
-
Проверка конфигурации BIOS/UEFI:
- Перезагрузите компьютер и войдите в BIOS/UEFI, обычно через нажатие клавиш Del, F2 или другой, в зависимости от модели материнской платы.
- Найдите настройки, связанные с PCIe или многократной графической поддержкой, и убедитесь, что они активированы.
-
Проверка и изменения в операционной системе:
- Проверьте, видят ли операционная система и драйвер вторую видеокарту, через терминал, используя команды:
lspci | grep NVIDIA
Это поможет увидеть все устройства NVIDIA, обнаруженные системой.
- Проверьте, видят ли операционная система и драйвер вторую видеокарту, через терминал, используя команды:
-
Команды для исправления конфигурации:
- Проверьте текущее состояние и параметры устройств:
nvidia-xconfig --query-gpu-info
- Исправьте конфигурацию при помощи:
nvidia-xconfig -a --device=Device0 --busid=[PCI Bus ID of GPU #0] --device=Device1 --busid=[PCI Bus ID of GPU #1]
- Перезагрузите систему, чтобы изменения вступили в силу.
- Проверьте текущее состояние и параметры устройств:
Эти шаги помогут диагностировать и, возможно, устранить проблему отсутствия второй видеокарты в NVIDIA-SMI
. Если проблема сохраняется, возможно потребуется дополнительное тестирование или обращение в службу поддержки по возможной аппаратной неисправности.