LM-Sensors – Intel Arc A750 + Dell R720 + Debian 11 (Ядро 6.2.2)

Вопрос или проблема

У меня дома стоит Dell R720, который запускает виртуализированные сервисы на KVM. Недавно я добавил Intel ARC A750, который передан виртуальной машине Debian 11 (с моделью машины Q35), где работает Jellyfin. Единственная цель карты — транскодирование видео.

Я собрал новый ядро 6.2.2 для виртуальной машины, чтобы запустить карту, и она работает замечательно.

Чтобы увидеть загрузку карты, я наткнулся на проект “intel-gpu-tools”, который прекрасно решает эту проблему с помощью “intel_gpu_top”.

Проблема

Учитывая, что вентиляторы карты направлены вниз, я не уверен, достаточно лиidle-скорости для ее охлаждения с учетом ее расположения (см. здесь). Я использую версию lm-sensors 3.6.0-7, и она сообщает:

i915-pci-0100
Адаптер: PCI адаптер
in0:           0.00 V  
power1:           N/A  (max = 190.00 W)
energy1:     244.36 kJ

Кажется, что lm-sensors, возможно, не был обновлен для этой карты, но он все еще, похоже, читает что-то. Какой предназначенный метод проверки температуры GPU?

согласно этой теме, Тем не менее, мониторинг температуры графической карты еще не поддерживается.

Сегодня я установил ядро rc1 и увидел температуру arc750 в командной строке.

Ядро v6.13-rc1введите описание изображения здесь

Ответ или решение

Использование LM-Sensors для мониторинга температуры GPU Intel Arc A750 на Debian 11

Введение

С возникновением новых графических карт, таких как Intel Arc A750, пользователи сталкиваются с вопросами об их мониторинге и управлении, особенно в отношении температуры и производительности. На примере вашего сервера Dell R720, который работает на виртуализированной платформе KVM с установленной Debian 11 и ядром 6.2.2, мы рассмотрим, как можно следить за температурой графического процессора и решить возникающие проблемы с охлаждением.

Характеристики системы

  1. Аппаратное обеспечение:

    • Сервер: Dell R720
    • Графическая карта: Intel Arc A750
    • Операционная система: Debian 11
    • Ядро: 6.2.2 (обновленное до версии 6.13-rc1 для улучшенной поддержки)
  2. Программное обеспечение:

    • LM-Sensors: версия 3.6.0-7
    • Инструменты для графических процессоров: intel-gpu-tools, использующийся для отслеживания загрузки GPU через intel_gpu_top.

Проблема с мониторингом температуры

Как вы указали, LM-Sensors не предоставляет полной информации о температуре вашей новой графической карты. Это связано с тем, что поддержка мониторинга температуры для Intel Arc A750 еще не была внедрена или была ограничена в более ранних версиях ядра. В вашей текущей конфигурации вывод LM-Sensors показывает базовые параметры:

  • Входное напряжение: 0.00 V
  • Энергопотребление: 244.36 kJ (максимально 190 W, без прямого указания температуры)

Решение проблемы

  1. Обновление ядра: С последним обновлением до ядра 6.13-rc1, вы заметили, что теперь можете видеть данные о температуре GPU. Это подтверждает, что мониторинг температуры Intel Arc A750 осуществляется именно через новые версии ядра, которые включают необходимые драйвера и поддержку.

  2. Инструменты для мониторинга: Вы можете использовать утилиту intel_gpu_top, как вы уже упоминали, для отслеживания нагрузки на карту. Однако для полного понимания работы GPUs, особенно в отношении температуры, важно учитывать также возможности более новых инструментов и библиотек:

    • intel-gpu-tools – для мониторинга загрузки.
    • i915 драйвер – для поддержки новых функций в вашем графическом процессоре.
  3. Рекомендации по охлаждению: Для обеспечения безопасной работы GPU в пространстве с низкой вентиляцией (в связи с расположением вентиляторов вниз), рекомендуется:

    • Проверить, чтобы в корпусе сервера было достаточно пространства для циркуляции воздуха.
    • Установить дополнительные вентиляторы или улучшить их размещение, если это необходимо.
    • Рассмотреть возможность использования терморегуляторов или программ для автоматизации управления вентиляторами на основе температуры GPU.

Заключение

Ваша система имеет хорошие шансы на оптимальное функционирование с Intel Arc A750, особенно после обновления ядра. Убедитесь, что вы используете самые последние версии драйверов и утилит для получения актуальных данных о состоянии вашего графического процессора. Это позволит минимизировать тепловые риски и поддерживать его в рабочем состоянии для ваших задач по транскодированию в Jellyfin.

Оцените материал
Добавить комментарий

Капча загружается...