Вопрос или проблема
У меня уже много лет установлен Ubuntu, и за это время я использовал 4-5 серверов. Все они имели внешние USB-диски, и я сталкивался с проблемами только когда жесткий диск выходил из строя по аппаратным причинам, но никогда не было внезапной деградации.
Недавно я установил новый сервер HP в компактном исполнении, на нем четыре порта USB 3.1. Операционная система – Ubuntu 24.04.1. Подключены четыре внешних жестких диска по 16 ТБ, Raid1 md0 = 16 + 16 ТБ и md1 = 16 + 16 ТБ, а Raid0 md2 = md0 + md1, в итоге получается aproximadamente 32 ТБ. Диски не новые, они работали около 1,5 лет на старом резервном сервере.
Проблема в том, что диски md0 или md1 sdN периодически выходят из строя, в логах только “Ошибки”. Syslog: md/raid1:md1: Ошибка диска на sdf1, отключение устройства.
Это может быть любой из этих четырех дисков. Этот сервер работает на Ubuntu 24.04.1, а другие четыре сервера на Ubuntu 22.04.4.
Это немного странно, если бы вышел из строя только один диск, я мог бы заподозрить порт USB или сам жесткий диск, но в данном случае это не так, все вываливаются случайным образом. (Действие: Выключить диск, включить и заново синхронизировать Raid).
Такого не происходило со старым сервером и с теми же дисками, ни с другими серверами на Ubuntu 22.04.5.
Может ли это быть проблемой Ubuntu версии 24.04.1, просто скромный вопрос?
Или это, скорее, проблема с аппаратным обеспечением сервера? Сервер: 2 x USB 3.2 Gen 2 (3.1 Gen 2) – 2 x USB 3.2 Gen 1 (3.1 Gen 1).
HDD: USB 3.0. Статус Smart показывает скорость передачи 6 Гбит/с по SATA. Один раздел/диск. Формат ext4 для Linux.
Ответ или решение
Проблемы с USB-дисками, особенно в конфигурациях с RAID, могут быть вызваны несколькими факторами, включая программное обеспечение или аппаратное обеспечение. В вашем случае вы описали ситуацию, когда диски в RAID1 (md0 и md1) начинают "отключаться" и появляется сообщение "Disk failure", что действительно может быть достаточно тревожным.
Возможные причины и рекомендации:
-
Совместимость с Ubuntu 24.04.1:
- Учитывая, что вы не сталкивались с подобными проблемами на предыдущих серверах с Ubuntu 22.04.4, имеет смысл провести более глубокое исследование возможных багов в версии 24.04.1. Возможно, имеется проблема с управлением USB-дисками или RAID в этой версии.
- Проверьте, имеются ли обновления и исправления, а также просмотрите журналы ошибок. Лучше всего начать с поиска в официальных отчетах о проблемах и форумах сообщества, чтобы увидеть, упоминают ли другие пользователи аналогичные проблемы.
-
Аппаратная проблема:
- Рассмотрите возможность проверки аппаратных компонентов сервера. Если у вас есть возможность, протестируйте эти же диски на другом сервере с Ubuntu 22.04.4, чтобы убедиться, что они работают корректно.
- Также стоит проверить, работают ли USB-порты правильно и не имеют ли физические повреждения. Не исключено, что порты USB 3.1/3.2 не обеспечивают должного питания или стабильности, необходимой для работы дисков.
- Попробуйте использовать разные USB-порты для подключения дисков, чтобы исключить возможность неисправности конкретного порта.
-
Питание и охлаждение:
- Убедитесь, что диски получают достаточное питание, особенно если они работают через концентратора. Иногда использование внешних источников питания для USB-дисков может решить проблему.
- Мониторьте температуру окружающей среды и самих дисков. Перегрев может быть одной из причин сбоя.
-
Настройки RAID и файловой системы:
- Поскольку вы используете RAID0 и RAID1, стоит проверить конфигурацию. Убедитесь, что вы правильно настроили raidxpert или другую утилиту для управления RAID.
- Возможно, имеет смысл протестировать диски с помощью тестов SMART (например, с помощью утилиты
smartctl
), чтобы выявить потенциальные проблемы с производительностью или повреждением данных.
-
Проверка логов:
- Посмотрите на системные логи (
/var/log/syslog
), чтобы выявить любые проблемы на уровне ОС и интерфейсов, связанных с ошибками записи или чтения. Обратите внимание на сообщения, предшествующие сбоям.
- Посмотрите на системные логи (
Заключение:
Если вышеуказанные шаги не помогут, возможно, стоит рассмотреть возможность возврата к более стабильной версии Ubuntu, пока выясняются причины проблем с RAID и USB на Ubuntu 24.04.1. Также, обратитесь к сообществу Ubuntu или больше специализированным форумам для получения помощи и советов от других пользователей с похожими конфигурациями.