RAID-10 – замените контроллер RAID

Вопрос или проблема

У меня настроен RAID-10 на контроллере LSI Logic 9211-4i (4 диска). Похоже, что контроллер неисправен. Каждые несколько дней он перестает работать, VMware записывает следующее: Потерян доступ к тому объему xxxxxxxx-xxxxxxxx-xxxx-xxxxxxxxxxxx (DATASTORE) из-за проблем с подключением. Попытка восстановления в процессе, и результат будет сообщён в ближайшее время.. Когда это происходит, только перезагрузка сервера помогает.

В теории RAID10 – это две зеркала, разбитые на полосы. Можно ли заменить контроллер на другой без потери данных?

Слышали ли вы выражение “если вы потеряете контроллер, вы потеряете ваши данные, если у вас нет такого же контроллера на полке”? Это часто говорится как недостаток аппаратных RAID.

Забудьте об этом. Это действительно далёкое прошлое. Те некомпетентные, которые всё ещё говорят эту чепуху сегодня, просто ничего не слышали о SNIA. А контроллеры LSI Logic часто используют SNIA DDF метаданные на диске.

Ваш первый вариант – попробовать другой контроллер LSI. Первое, на что стоит обратить внимание – это такой же, но с 8i (8 SAS портов вместо 4). Полностью другая модель LSI также должна работать. Однажды я подключил диски от старого DELL PERC (который является OEM LSI) к новому контроллеру LSI, и он собрал RAID-массив из тех дисков так, как если бы он был создан им самим.

Другой вариант – использовать Linux. Его хвалят за драйвер программного RAID md, который также знает формат DDF, поэтому он распознает его и способен собирать и получать доступ к виртуальным дискам этого формата. Просто найдите любой SAS HBA, подключите диски и загрузите Linux, а затем посмотрите, что в /proc/mdstat. Таким образом, вы по крайней мере сможете сделать дамп собранного виртуального диска на какой-то новый диск без RAID и запустить VMWare с этого диска.

Трудный способ – собрать RAID10 вручную, что также возможно сделать с помощью Linux. Это не слишком сложно. Подумайте об этом, как если бы это был RAID0 из RAID1 (полосатые зеркала); вам нужно определить “зеркальные пары” и взять диск из каждой пары. Затем вам нужно угадать размер полосы, что несложно, обычно изучение дисков с помощью какого-то прямого шестнадцатеричного редактора позволяет сделать это почти мгновенно. Затем вы собираете программный RAID “вручную” без “метаданных”, и вы можете сделать дамп вашего виртуального диска.

У меня установлен RAID 5 из 5 дисков на LSI 9260-8i. Контроллер вышел из строя. Он вроде бы работает, но замедляет процесс загрузки на несколько минут и иногда заставляет ПК вести себя странно.

Я сохранил конфигурацию на диск, заменил контроллер, но он не загружает конфигурацию. Он также не видит массив (он видит диски). BIOS на контроллерах идентичный.

Новый контроллер загружается за нормальное время и не негативно влияет на ПК.

Я не могу импортировать чужой массив или загрузить конфигурацию.

Это 80TB массив. Я могу вставить старый контроллер, и когда он включается, увидеть массив. Но это долгий процесс резервного копирования, и нет гарантии, что он завершится без зависания.

Есть ли какие-либо предложения?

Ответ или решение

Замена контроллера RAID-10 без потери данных

При возникновении проблем с контроллером RAID, как в вашем случае с LSI Logic 9211-4i, важно провести замену с минимальными рисками для целостности данных. В данной статье мы рассмотрим шаги и варианты, позволяющие выполнить замену контроллера RAID-10 без потери данных, а также уточним технические аспекты, касающиеся структуры RAID и работы с контроллерами.

Понимание RAID-10

RAID-10, также известный как RAID 1+0, представляет собой комбинацию двух технологий: RAID 1 (зеркалирование) и RAID 0 (полосование). Это означает, что данные дублируются между парами дисков, а затем эти пары комбинируются для получения высокой производительности и устойчивости к сбоям. Работа с RAID-10 осуществляется с использованием метаданных, которые описывают конфигурацию массива на дисках.

Возможность замены контроллера

  1. Совместимые контроллеры: Ваш первый шаг в замене контроллера должен быть направлен на поиск совместимого устройства. Как правило, рекомендуется использовать контроллер той же модели LSI, но можно также попытаться использовать другой контроллер LSI. Современные контроллеры часто поддерживают стандарт SNIA DDF, что позволяет импортировать конфигурации RAID, созданные на других контроллерах.

  2. Проверка кода и установленного ПО: Убедитесь, что BIOS и прошивка контроллера совпадают с теми, что были на старом контроллере. Наличие одинаковой версии поможет избежать проблем с совместимостью.

  3. Использование программного обеспечения RAID: Если замена контроллера не удалась или если вы хотите избежать дополнительных рисков, можно использовать инструменты на базе Linux. Например, программное обеспечение md (Multi-Disk) поддерживает чтение метаданных DDF и может собрать массив на новом контроллере или HBA (Host Bus Adapter). Для этого:

    • Установите Linux и подключите диски к серверу.
    • Запустите команду cat /proc/mdstat, чтобы увидеть доступные RAID-массивы.

Порядок действий при замене контроллера

  1. Подготовка: Сделайте резервную копию данных, если это возможно, используя старый контроллер.
  2. Физическая замена: Установите новый контроллер LSI, следя за правильным подключением дисков.
  3. Конфигурация BIOS: Настройте BIOS контроллера таким образом, чтобы он мог распознать массив RAID.
  4. Импорт массива: Если контроллер сообщает о «foreign array», используйте опции импорта массива в BIOS нового контроллера.
  5. Проверка и восстановление: Запустите систему, откройте VMware и проверьте доступность datastore.

Альтернативные методы

Если контроллер не распознает массив RAID, вы можете попробовать следующие действия:

  • Программный RAID: Подключите диски к Linux и попробуйте собрать RAID-10 вручную на md без метаданных, анализируя пары зеркал и определяя размер полосы.
  • Оптимизация резервного копирования: Используйте старый контроллер для резервирования данных, если новый не распознает массив. Несмотря на возможные сбои, это может помочь сохранить данные.

Заключение

Замена контроллера RAID-10 может быть сложной задачей, однако, при соблюдении всех рекомендаций и понимании структуры RAID, можно минимизировать риски потери данных. Всегда действуйте осторожно и, при необходимости, проконсультируйтесь с профессионалами в области IT или RAID-технологий, чтобы обеспечить успешное восстановление и работоспособность вашей системы.

Оцените материал
Добавить комментарий

Капча загружается...