Ошибки HDD при использовании LSI 9207-8i с материнской платой Supermicro

Вопрос или проблема

Несколько лет назад я приобрёл сервер хранения Supermicro – конкретно SuperStorage 6047R-E1R36N. Изначально он был оснащён контроллером LSI/Broadcom 2108 SAS2 RAID AOC HBA, который был подключен к переднему обратно-соединительному модулю (Supermicro BPN-SAS2-846EL1), поддерживающему 24 диска, и заднему обратно-соединительному модулю (Supermicro BPN-SAS2-826EL1).

Поскольку я хотел использовать программный RAID вместо аппаратного, я заменил 2108 на LSI 9207-8i и подключил его к переднему и заднему обратно-соединительным модулям так же, как и 2108. Прошивка – 20.00.07.00-IT.

Диски, установленные на переднем обратно-соединительном модуле, работают без проблем. Но когда я попробовал установить диски на заднем обратно-соединительном модуле, они были распознаны, но я продолжал получать ошибки. Я знаю, что это не диски, потому что, когда я заметил ошибки, я попробовал переместить тот же диск на передний обратно-соединительный модуль, и он заработал без проблем. Я почти уверен, что это не кабель, соединяющий 9207 с задним обратно-соединительным модулем, так как я пробовал заменить его на новый кабель и всё равно получал те же ошибки. Я пробовал разные слоты для заднего обратно-соединительного модуля, но всё равно получал те же ошибки. Я смог разделить диски, но попытки записать на них не увенчались успехом.

Я запускаю Debian на сервере, и dmesg показывает следующие ошибки, когда диски выходят из строя на заднем обратно-соединительном модуле – я немного отредактировал, чтобы удалить повторяющиеся строки с одной и той же ошибкой:

[55896.254500] mpt2sas_cm0: log_info(0x31120303): originator(PL), code(0x12), sub_code(0x0303)
[55896.254546] sd 0:0:26:0: [sdz] tag#3446 FAILED Result: hostbyte=DID_SOFT_ERROR driverbyte=DRIVER_OK
[55896.254558] sd 0:0:26:0: [sdz] tag#3446 CDB: Read(16) 88 00 00 00 00 00 02 0c 96 e0 00 00 00 18 00 00
[55896.254565] blk_update_request: I/O error, dev sdz, sector 34379488 op 0x0:(READ) flags 0x80700 phys_seg 3 prio class 0
[55896.255545] sd 0:0:26:0: [sdz] tag#3436 FAILED Result: hostbyte=DID_SOFT_ERROR driverbyte=DRIVER_OK
[55896.255547] sd 0:0:26:0: [sdz] tag#3436 CDB: Read(16) 88 00 00 00 00 00 02 0c 94 60 00 00 00 18 00 00
[55896.255549] blk_update_request: I/O error, dev sdz, sector 34378848 op 0x0:(READ) flags 0x80700 phys_seg 3 prio class 0
[55897.004292] sd 0:0:26:0: Power-on or device reset occurred
[55902.038356] JBD2: Detected IO errors while flushing file data on sdz1-8
[55906.255274] scsi_io_completion_action: 22 callbacks suppressed
[55906.255276] print_req_error: 22 callbacks suppressed
[55906.255282] blk_update_request: I/O error, dev sdz, sector 34481280 op 0x0:(READ) flags 0x80700 phys_seg 30 prio class 0
[55906.255286] sd 0:0:26:0: [sdz] tag#3483 FAILED Result: hostbyte=DID_SOFT_ERROR driverbyte=DRIVER_OK
[55906.255994] sd 0:0:26:0: [sdz] tag#3483 CDB: Read(16) 88 00 00 00 00 00 01 f1 14 a0 00 00 03 60 00 00
[55906.255998] blk_update_request: I/O error, dev sdz, sector 32576672 op 0x0:(READ) flags 0x80700 phys_seg 108 prio class 0

Я немного растерян с тем, как дальше диагностировать или исправить проблему. Буду очень признателен за любые предложения или рекомендации.

Ответ или решение

Здравствуйте,

Поскольку вы уже заменили контроллер RAID на LSI 9207-8i и подключили его к заднему бекплейну Supermicro BPN-SAS2-826EL1, важно выяснить, почему вы испытываете ошибки ввода-вывода (I/O) при работе с дисками, подключенными к этому бекплейну.

Возможные причины ошибки:

  1. Совместимость бекплейна и контроллера: Проверьте, поддерживает ли ваш бекплейн Supermicro BPN-SAS2-826EL1 LSI 9207-8i. Обновление прошивки бекплейна может также помочь.

  2. Конфигурация дисков: Убедитесь, что все диски в заднем бекплейне правильно сконфигурированы и совместимы с указанным контроллером. Иногда диски могут иметь проблемы при работе в определенных режимах.

  3. Кабели и подключения: Несмотря на то что вы заменили кабель, убедитесь, что он надежно подключен и не поврежден. Попробуйте использовать другой порт на контроллере, чтобы исключить возможность неисправности конкретного порта.

  4. Ошибка питания: Убедитесь, что задний бекплейн получает достаточное питание. Проверьте подключения к блоку питания и целостность кабелей.

  5. Проблемы с прошивкой: Попробуйте установить более актуальную версию прошивки для LSI 9207-8i. Иногда обновления можно найти на официальном сайте Broadcom.

Рекомендации по диагностике:

  1. Проверьте журналы системы: Используйте команды dmesg и journalctl для мониторинга ошибок, связанных с дисками, подключенными к заднему бекплейну.

  2. Тестирование дисков: Запустите утилиты для тестирования дисков, такие как smartctl, чтобы проверить состояние здоровья подключенных дисков.

    sudo smartctl -a /dev/sdz
  3. Используйте другой контроллер: Если у вас есть доступ к другому контроллеру SAS, попробуйте подключить его к заднему бекплейну для проверки, сохраняются ли ошибки.

  4. Проверьте конфигурацию BIOS/UEFI: Убедитесь, что в настройках BIOS/UEFI вашего сервера нет параметров, влияющих на работу SAS-контроллеров или SATA-дисков.

Реальные решения:

  1. Замените LSI 9207-8i на другой контроллер: Если проблема не решится, возможно, стоит рассмотреть возможность возврата к LSI/Broadcom 2108 или выбрать другой совместимый контроллер.

  2. Обратитесь в службу поддержки Supermicro: Если описанные решения не помогли, обратитесь в техническую поддержку Supermicro, предоставив все детали ситуации.

Заключение:

Ошибки, которые вы наблюдаете, могут быть обусловлены множеством факторов, начиная от совместимости аппаратного обеспечения и заканчивая проблемами с прошивкой. Я настоятельно рекомендую вам пройти все шаги, указанные выше, чтобы изолировать и решить проблему. Если требуется дополнительная помощь, не стесняйтесь обращаться.

Надеюсь, это поможет вам разобраться с вашей проблемой.

С уважением.

Оцените материал
Добавить комментарий

Капча загружается...