Ubuntu RAID1 не загружается

Вопрос или проблема

Это машина, к которой я подключен удаленно, поэтому не могу сделать очевидное (посмотреть, что происходит в консоли).

На машине есть 4 диска: sda, sdb, sdc и sdd. sda и sdb настроены как один программный RAID1, а sdc и sdd настроены как один программный RAID1.

Личности : [raid1] [linear] [multipath] [raid0] [raid6] [raid5] [raid4] [raid10] 
md0 : активный raid1 sda3[0] sdb3[2]
     3877589824 блоков супер 1.2 [2/2] [UU]

md1 : активный raid1 sdb4[2] sda4[0]
     4877248 блоков супер 1.2 [2/2] [UU]

md3 : активный raid1 sdc1[2] sdd1[1](F)
     3906886272 блоков супер 1.2 [2/1] [U_]

md2 : активный raid1 sda5[0] sdb5[2]
     18538368 блоков супер 1.2 [2/2] [UU]

Как видите, устройство sdd вышло из строя. Оно вышло из строя так серьезно, что /dev/sdd не было в системе. Где я тогда ошибся, так это в том, что подумал, что если устройства нет, RAID не распознает его, поэтому мне не нужно было выполнять

mdadm --manage /dev/md3 --fail /dev/sdd1
mdadm --manage /dev/md3 --remove /dev/sdd1

Оглядываясь назад, мне не нужно было выполнять первую из этих строк, но мне следовало выполнить вторую. Ой.

Я удаленно выключил машину, и моя полезная “удаленная рука” извлекла диск, проверила, что серийный номер соответствует ожидаемому, и заменил его новым диском. Машина не перезагрузилась (монитора или клавиатуры нет, и подключить одно из них неудобно). Затем мы снова заменили новый диск на старый (осознав мою ошибку) и перезагрузили. Снова она не перезагрузилась.

Есть ли идеи, что здесь произошло и как это исправить? Я предполагаю, что может потребоваться выезд на место – что будет связано с международным перелетом!

Загрузочный раздел находится на md0 (по памяти) – определенно другая пара дисков. md3 это /var/backup или что-то подобное. Он монтируется при загрузке, но не является критически важным.

Ответ или решение

Проблема загрузки Ubuntu RAID1: Что делать?

В обсуждаемой ситуации существует несколько ключевых моментов, которые нужно учесть для диагностики проблемы с загрузкой системы на основе программного RAID1. Мы рассмотрим вашу конфигурацию, потенциальные причины неисправности и шаги, которые могут помочь восстановить работоспособность системы.

Конфигурация системы

У вас имеется следующая конфигурация дисков:

  • RAID1 на sda и sdb (md0 и md1): Эти диски функционируют корректно, судя по выводу команды mdadm.
  • RAID1 на sdc и sdd (md3): В этом массиве sdd уже вышел из строя, и, как вы упомянули, он был не доступен, что могло привести к возникновению ошибок во время загрузки.

Причины проблемы при загрузке

  1. Неисправный массив RAID: Поскольку sdd вышел из строя, и вы не удалили его из массива md3, система могла заблокироваться при попытке загрузки. RAID1 требует как минимум двух активных дисков для работы, что может вызвать проблемы.

  2. Неверное состояние массивов: Проблемы с конфигурацией RAID могут привести к нахождению системы в нестабильном состоянии. Например, если команды --fail и --remove не были выполнены должным образом, массив мог оказаться в состоянии, которое предотвратит его функциональность.

  3. Загрузочный раздел: Вы упомянули, что загрузочный раздел находится на md0. Если md0 в порядке, но конфигурация загрузщика был нарушена из-за действий с другими массивами, это также может быть причиной.

  4. Отсутствие носителей: Если BIOS/UEFI неправильно настроен на загрузку с RAID-массива, это также может быть причиной, по которой система не загружается.

Рекомендации по восстановлению

Для решения проблемы вам может понадобиться выполнить несколько шагов при физической доступности к серверу:

  1. Проверка массивов RAID: Убедитесь, что массив md3 корректно настроен. Запустите команду:

    mdadm --detail /dev/md3

    Если массив находится в состоянии degraded, попробуйте вручную удалить отсутствующий диск с помощью:

    mdadm --manage /dev/md3 --remove /dev/sdd1
  2. Загрузка с Live CD/USB: Если убытие загрузки продолжается, рассмотрите возможность загрузки с Live CD или USB-устройства. Это позволит вам получить доступ к RAID и проверить его состояние, а также, если это потребуется, внести изменения в конфигурацию загрузчика.

  3. Переустановка загрузчика: Если вы сможете получить доступ к массиву md0, проверьте конфигурацию GRUB. Если необходимо, переустановите загрузчик:

    grub-install /dev/md0
    update-grub
  4. Проверка BIOS/UEFI: Убедитесь, что порядок загрузки установленных дисков правильно настроен. RAID-массив должен быть в верхней части списка.

  5. Логи и уведомления: Если вы сможете получить доступ к системе, проверьте логи:

    dmesg | grep md
    cat /var/log/syslog | grep md

    Это может дать информацию о том, что произошло во время загрузки и какие ошибки были зарегистрированы.

Заключение

Подводя итог, можно сказать, что ошибка загрузки Ubuntu, связанная с RAID1, может быть следствием неправильного управления массивами или неправильной настройки загрузки. Надеюсь, предложенные шаги помогут вам восстановить систему. В будущем, чтобы избежать таких ситуаций, рекомендуется регулярно проверять состояние массивов и следовать более строгим процедурам по управлению RAID. Если проблемы продолжают возникать, возможно, действительно потребуется личная встреча для детальной диагностики.

Оцените материал
Добавить комментарий

Капча загружается...