Вопрос или проблема
Мне нужно восстановить данные с моего SW-RAID из-за слишком старой резервной копии и выхода из строя нескольких жестких дисков. Есть более новые файлы, которые мне нужно вернуть. Кроме того, есть проблема с системой уведомлений, поэтому я не знал о сбоях дисков.
У меня был массив RAID6 с 6 жесткими дисками, созданный как SW-RAID с помощью mdadm.
Теперь 3 устройства вышли из строя, я не могу сказать, когда первые два вышли из строя.
После сбоя 3-го устройства я остановил массив и создал полную резервную копию всех 6 дисков с помощью DMDE.
На последнем вышедшем из строя устройстве было 16 ошибок чтения, что привело к 8.19 кБ поврежденных данных. Поэтому я предполагаю, что большая часть данных в порядке, и я могу их спасти. Но я не знаю, как это сделать.
Я создал клоны всех вышедших из строя дисков, и моя идея заключается в том, чтобы отметить последний вышедший из строя как исправный и восстановить массив с остальными 3 исправными жесткими дисками, но это не работает для меня.
Я пробовал сделать это следующим образом:
Создание массива с принудительным использованием было возможно с 3 исправными жесткими дисками и первым вышедшим из строя. Но данные были практически недоступны для чтения. Поэтому я попытался добавить последний вышедший из строя с помощью:
sudo mdadm --manage /dev/md0 --add /dev/sdf1
mdadm: добавлен /dev/sdf1
Теперь я могу удалить первый вышедший из строя диск, но это не работает/синхронизируется, хотя отмечено, что он восстанавливается
sudo mdadm --assemble --force /dev/md0 /dev/sdb1 /dev/sdc1 /dev/sdg1 /dev/sdf1
mdadm: /dev/md0 собран из 3 дисков и 1 восстанавливающегося - недостаточно для запуска массива.
Суперблоки в порядке, я пытался поместить их здесь, но это было не особо читаемо из-за плохого оформления.
Ответ или решение
Введение:
Ваша ситуация ясна и представляет собой сложную задачу восстановления данных с программного RAID6, где отказало сразу три жестких диска. RAID6 конструктивно способен выдержать отказ до двух HDD, сохраняя при этом корректность данных, но выход из строя третьего приводят к потере избыточности и доступности данных. Рассмотрим теоретические аспекты, примеры в реальных условиях и практические шаги для решения проблемы восстановления данных.
Теоретическая часть:
RAID6 использует двойное разноуровневое кодирование для обеспечения возможности восстановления данных при отказе до двух дисков. Он распределяет данные и паритетные блоки по всем дискам в массиве. Когда один диск выходит из строя, его данные могут быть восстановлены за счет паритета. Однако, при отказе трех дисков, восстанавливаемость данных напрямую зависит от условий и того, какие именно диски вышли из строя.
Важно отметить, что при отказе более двух дисков, RAID6 не может гарантировать восстановление данных средствами стандартного пересчёта паритета. В подобных ситуациях необходимо использовать специальные методы обработки и восстановления данных, учитывая различные факторы, такие как: состояние оставшихся дисков, наличие и состояние резервных копий данных, возможность физических повреждений и другие аспекты.
Пример из практики:
Вы произвели резервное копирование всех шести дисков, что уже является положительным шагом. Однако эти резервные копии были созданы после выхода из строя трёх дисков, что может влиять на полноту и целостность данных. Ваши попытки восстановить массив с помощью утилизации команды mdadm
не увенчались успехом из-за нехватки активных и синхронизированных дисков для полного получения массива.
Практическая часть:
-
Оценка состояния резервных копий: Используйте специализированные программы для анализа состояния данных в резервных копиях. Возможно, часть данных остаётся доступной для восстановления средствами обработки разрозненных файлах или секторов.
-
Использование специализированного ПО: Для восстановления данных с поврежденных RAID, в случае выхода большего количества дисков, стоит привлечь специализированные инструменты, такие как R-Studio, ReclaiMe, или ZAR Data Recovery. Они имеют функционал для анализирования и восстановления данных с поврежденных или частично доступных RAID-массивов.
-
Профессиональная помощь: Если данные имеют огромную ценность или крайне критичны для вашего бизнеса, обратитесь в специализированные лаборатории по восстановлению данных. Они обладают не только специализированным ПО, но и оборудованием для физического восстановления данных с поврежденных носителей.
-
Анализ диагностических данных: Проведите полное логирование всех действий в процессе восстановления, чтобы иметь возможность обратиться к ним для последующего анализа и, возможно, корректировки диагностического процесса.
-
План восстановления: Создайте детальный план действий по восстановлению, включающий в себя пошаговые процессы и цель на каждом этапе. Введение в эксплуатацию RAID-массива с частично восстановленными данными может привести к дополнительным повреждениям.
-
Обеспечение надёжности инфраструктуры: На будущее, настройте более надёжную систему оповещений и мониторинга состояния дисков, создайте регулярные и полные резервные копии данных, примените более устойчивые к отказам системы, такие как ZFS, которые включают в себя встроенные механизмы для защиты данных от повреждений.
Заключение:
Восстановление данных с программного RAID6 при отказе трёх дисков — сложный и рискованный процесс, требующий как глубоких знаний в области администрирования RAID, так и применения специализированных инструментов и методик. Следуя вышеуказанным рекомендациям и подходам, вы сможете максимально повысить шансы на успешное восстановление критически важных данных.