Вопрос или проблема
Это машина, к которой я подключен удаленно, поэтому не могу сделать очевидное (посмотреть, что происходит в консоли).
На машине есть 4 диска: sda, sdb, sdc и sdd. sda и sdb настроены как один программный RAID1, а sdc и sdd настроены как один программный RAID1.
Личности : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10]
md0 : активный raid1 sda3[0] sdb3[2]
3877589824 блоков супер 1.2 [2/2] [UU]
md1 : активный raid1 sdb4[2] sda4[0]
4877248 блоков супер 1.2 [2/2] [UU]
md3 : активный raid1 sdc1[2] sdd1[1](F)
3906886272 блоков супер 1.2 [2/1] [U_]
md2 : активный raid1 sda5[0] sdb5[2]
18538368 блоков супер 1.2 [2/2] [UU]
Как видите, устройство sdd вышло из строя. Оно вышло из строя так серьезно, что /dev/sdd не было в системе. Где я тогда ошибся, так это в том, что подумал, что если устройства нет, RAID не распознает его, поэтому мне не нужно было выполнять
mdadm --manage /dev/md3 --fail /dev/sdd1
mdadm --manage /dev/md3 --remove /dev/sdd1
Оглядываясь назад, мне не нужно было выполнять первую из этих строк, но мне следовало выполнить вторую. Ой.
Я удаленно выключил машину, и моя полезная “удаленная рука” извлекла диск, проверила, что серийный номер соответствует ожидаемому, и заменил его новым диском. Машина не перезагрузилась (монитора или клавиатуры нет, и подключить одно из них неудобно). Затем мы снова заменили новый диск на старый (осознав мою ошибку) и перезагрузили. Снова она не перезагрузилась.
Есть ли идеи, что здесь произошло и как это исправить? Я предполагаю, что может потребоваться выезд на место – что будет связано с международным перелетом!
Загрузочный раздел находится на md0 (по памяти) – определенно другая пара дисков. md3 это /var/backup
или что-то подобное. Он монтируется при загрузке, но не является критически важным.
Ответ или решение
Проблема загрузки Ubuntu RAID1: Что делать?
В обсуждаемой ситуации существует несколько ключевых моментов, которые нужно учесть для диагностики проблемы с загрузкой системы на основе программного RAID1. Мы рассмотрим вашу конфигурацию, потенциальные причины неисправности и шаги, которые могут помочь восстановить работоспособность системы.
Конфигурация системы
У вас имеется следующая конфигурация дисков:
- RAID1 на sda и sdb (md0 и md1): Эти диски функционируют корректно, судя по выводу команды
mdadm
. - RAID1 на sdc и sdd (md3): В этом массиве sdd уже вышел из строя, и, как вы упомянули, он был не доступен, что могло привести к возникновению ошибок во время загрузки.
Причины проблемы при загрузке
-
Неисправный массив RAID: Поскольку sdd вышел из строя, и вы не удалили его из массива
md3
, система могла заблокироваться при попытке загрузки. RAID1 требует как минимум двух активных дисков для работы, что может вызвать проблемы. -
Неверное состояние массивов: Проблемы с конфигурацией RAID могут привести к нахождению системы в нестабильном состоянии. Например, если команды
--fail
и--remove
не были выполнены должным образом, массив мог оказаться в состоянии, которое предотвратит его функциональность. -
Загрузочный раздел: Вы упомянули, что загрузочный раздел находится на
md0
. Еслиmd0
в порядке, но конфигурация загрузщика был нарушена из-за действий с другими массивами, это также может быть причиной. -
Отсутствие носителей: Если BIOS/UEFI неправильно настроен на загрузку с RAID-массива, это также может быть причиной, по которой система не загружается.
Рекомендации по восстановлению
Для решения проблемы вам может понадобиться выполнить несколько шагов при физической доступности к серверу:
-
Проверка массивов RAID: Убедитесь, что массив
md3
корректно настроен. Запустите команду:mdadm --detail /dev/md3
Если массив находится в состоянии
degraded
, попробуйте вручную удалить отсутствующий диск с помощью:mdadm --manage /dev/md3 --remove /dev/sdd1
-
Загрузка с Live CD/USB: Если убытие загрузки продолжается, рассмотрите возможность загрузки с Live CD или USB-устройства. Это позволит вам получить доступ к RAID и проверить его состояние, а также, если это потребуется, внести изменения в конфигурацию загрузчика.
-
Переустановка загрузчика: Если вы сможете получить доступ к массиву
md0
, проверьте конфигурацию GRUB. Если необходимо, переустановите загрузчик:grub-install /dev/md0 update-grub
-
Проверка BIOS/UEFI: Убедитесь, что порядок загрузки установленных дисков правильно настроен. RAID-массив должен быть в верхней части списка.
-
Логи и уведомления: Если вы сможете получить доступ к системе, проверьте логи:
dmesg | grep md cat /var/log/syslog | grep md
Это может дать информацию о том, что произошло во время загрузки и какие ошибки были зарегистрированы.
Заключение
Подводя итог, можно сказать, что ошибка загрузки Ubuntu, связанная с RAID1, может быть следствием неправильного управления массивами или неправильной настройки загрузки. Надеюсь, предложенные шаги помогут вам восстановить систему. В будущем, чтобы избежать таких ситуаций, рекомендуется регулярно проверять состояние массивов и следовать более строгим процедурам по управлению RAID. Если проблемы продолжают возникать, возможно, действительно потребуется личная встреча для детальной диагностики.