Smart Array P420i, логический диск не работает, лучший способ повторно включить.

Question 1

У меня есть сервер HP Proliant ML380p Gen8 с контроллером P420i, где один из логических дисков внезапно вышел из строя.

Скриншот Smart Storage Administrator

Из того, что я видел в Smart Storage Administrator, ни один из физических дисков в массиве не имеет проблем.

У меня есть возможность повторно включить неработающий логический диск (см. скриншот), но я понял из различных сообщений на форумах, что если это не сработает, я потеряю все данные на дисках. Поэтому я решил сначала создать копии всех четырех дисков.

Я использовал ddrescue и USB SATA-док для создания этих копий, и смог получить полную копию дисков B и D (см. скриншот). Однако как для диска A, так и для диска C удалось скопировать около 74% диска, после чего ddrescue не смог считывать больше данных.

В массиве RAID 1+0 диски должны иметь такую раскладку:

Схема RAID 1+0

Теперь у меня следующие вопросы:

Если диски A, B, C, D настроены в порядке, показанном на скриншоте Smart Storage Administrator выше, означает ли это, что (A + B) является парой RAID 1, а (C + D) также является парой RAID 1, и имея полные копии дисков B и D, у меня есть копия всех данных?

Если вышеуказанное верно, то мне нужен совет, как попытаться ‘повторно включить логический диск’:

Должен ли я вернуть все 4 диска обратно в сервер, включая те, которые я не смог полностью прочитать с помощью ddrescue, и затем попытаться повторно включить ИЛИ
Должен ли я вернуть в сервер только диски B и D (те, которые я смог полностью прочитать с помощью ddrescue), и затем попытаться повторно включить?

Спасибо за ответы на эти вопросы, или любые другие советы или рекомендации

Question 2

Во-первых, ваш сервер более чем на два года вышел за пределы срока поддержки — что не идеально. Также я бы даже не пытался реализовать идею ‘создания копий всех четырех дисков’ — это крайне маловероятно, что это вам поможет.

Если у вас все еще есть доступ к вашим данным, просто сделайте их резервное копирование, если вы этого еще не сделали — уничтожьте и воссоздайте логический диск и восстановите ваши данные. Я знаю, что это требует много работы и простоя, но это единственный способ точно знать, что вы получите рабочую систему.

Или… получите более новый сервер с поддержкой и восстановите данные на него — решите две проблемы!

Question 3

Просто повторно включите логический диск.
Я бы спросил, что послужило причиной, но это, вероятно, не важно.

Question 4

Я смог скопировать только около 74% диска, прежде чем ddrescue не смог считывать больше данных.

Похоже, вы попались на миф RAID защищает мои данные в любом случае. RAID настолько надежен, насколько вы его проверяте и мониторите — битовая гниль может привести к множественным сбоям чтения, если не проводить регулярную проверку; множественные сбои чтения приводят к полному выходу из строя вашего массива. Также, RAID не заменяет актуальную, хорошую и проверенную резервную копию.

Тщательно проверьте диски (или замените их сразу).
Замените все неисправные/ненадежные диски.
Повторно включите массив, отформатировав диски.
Восстановите данные из резервной копии.
Убедитесь, что вы включили еженедельную/регулярную проверку данных, также называемую патрулем носителя, чтобы избежать будущих ошибок при чтении.

Smart Array P420i, логический диск не работает, лучший способ повторно включить.

Вопрос или проблема

Ответ или решение

Теория

Пример

Применение

Шаги по восстановлению:

Предотвращение будущих проблем:

Заключение