Вопрос или проблема
Мне нужно восстановить файл ВМ объемом 160 ГБ с HP ProLiant DL380 G7. Четыре диска по 146 ГБ имеют массив RAID5 с двумя разделами.
Проблема в том, что они разместили файл ВМ Windows Server, и отсеки для дисков 2/3 выходят из строя: отсек 2 находится на грани отказа, а отсек 3 перегревается, что вызывает автоматическое выключение сервера через 50 минут после попытки восстановления данных на внешний жесткий диск.
Как только начинается передача данных на внешний жесткий диск, свет системы меняется с зеленого на красный. Я проверил журналы BIOS, и один из дисков перегревается.
Что мне делать?
Начните с устранения проблем с перегревом. Причиной может быть неработающий вентилятор (определите его и замените на функционирующий, они обычно стандартные), вентиляционные отверстия, засоренные пылью (используйте домашний или промышленный пылесос), или необходимость переместить всю вашу установку в кондиционируемое помещение, где прохладнее. Это даже может быть комбинация этих факторов.
После того, как вы решите проблему перегрева, приступайте к эвакуации данных. Подсказка: не откладывайте, так как если 2 из 4 дисков в вашем RAID5 выйдут из строя, вашей единственной возможностью восстановления будет внешний резервный копия.
.
Ответ или решение
Восстановление данных с RAID5 массива при выходе из строя двух жестких дисков представляет собой сложную задачу, так как RAID5 способен выдержать отказ только одного диска без потери данных. В вашей ситуации отказали два диска из четырех, что значительно усложняет восстановление данных. Однако есть несколько шагов, которые могут помочь в этом критическом случае.
Теория (Theory)
RAID5 использует чередование данных с распределением чексуммы (см. паритет) по всем дискам. Это обеспечивает отказоустойчивость при потере одного жесткого диска. При отказе второго диска традиционное восстановления массива становится невозможным, так как данные и паритет распределены и более не содержат полную необходимую информацию для восстановления.
Пример (Example)
Вы описали свою проблему как частичный выход из строя жестких дисков в HP ProLiant DL380 G7, где два диска из четырех в массиве RAID5 либо уже отказали, либо находятся на стадии отказа. Быстрое отключение системы связано с перегревом одного из дисков, что еще больше усугубляет задачу. Кроме того, сохранившийся сервер может позволить попытки частичного копирования на внешний HDD, но из-за технических ограничений и времени, необходимого для этих операций, общий процесс восстанавливаемости затруднен.
Применение (Application)
Шаги по решению проблемы
-
Устранение перегрева
- Проверка охлаждения: Убедитесь, что все вентиляторы работают должным образом. Если один из вентиляторов не работает, немедленно замените его. Это может включать как замену самих вентиляторов, так и наличной проверке всей системы охлаждения.
- Очистка от пыли: Зачастую системы перегреваются из-за накопившейся пыли в вентиляционных отверстиях. Используйте пылесос для очистки корпуса и улучшения циркуляции воздуха.
- Создание условий охлаждения: Переместите оборудование в более прохладную среду, если это возможно. Это может существенно улучшить охлаждение и уменьшить риски перегрева.
-
Запуск восстановления
- Оценка состояния дисков: Если возможно, используйте SMART данные для проверки состояния оставшихся дисков. Оцените вероятность того, что диски способны продержаться во время процесса копирования.
- Сбор данных: Работайте с оставшимися дисками и пробуйте извлекать как можно больше данных. Это может занять несколько попыток и использование различного программного обеспечения для восстановления данных.
- Внешние сервисы: Если внутренние усилия не приносят результатов, рассмотрите варианты использования сторонних профессиональных сервисов по восстановлению данных от поврежденных RAID массивов. Эти услуги могут быть дорогостоящими, но у них могут быть инструменты и опыты, которые могут помочь в вашей ситуации.
-
Альтернативные меры
- Восстановление из бэкапов: Если у вас есть копии бэкапов, дублирующих важные данные, используйте их для восстановления информации. Это безусловно лучший вариант в случае полного выхода из строя нескольких дисков массива.
- Документирование проблемы: Запишите все шаги, которые вы предпринимали для устранения проблемы. Это может помочь в будущем избежать повторения такой ситуации и обеспечить лучшее планирование на случай катастроф.
Соображения
- Управление рисками: Учитывая текущую ситуацию, крайне важно заранее планировать и предоставить более надежные схемы резервного копирования данных.
- Инвестиции в более надежные системы: Теперь может быть подходящий момент для рассмотрения инвестиций в более современные массивы, такие как RAID6 или RAID10, которые обеспечивают большую избыточность и надежность.
Резюмируя, задача восстановления массива RAID5 с двумя отказавшими дисками является крайне сложной и часто неразрешимой без специальных инструментов и профессиональной помощи. При высокой критичности данных не стоит пренебрегать обращением к профессиональным службам для минимизации потерь.