OCFS2 + ISCSI – Ошибка монтирования “Режим сердцебиения недействителен при попытке присоединиться к группе”

Вопрос или проблема

Кластер OCFS2 с двумя узлами пытается работать с хранилищем, имеющим два блочных устройства. Эти устройства共享ся через iSCSI и видимы на обоих узлах. Меньший диск (230 Гб) используется дляheartbeat, больший (5,5 Тб) – для хранения. Однако, если я пытаюсь смонтировать устройство или mpath устройства, я получаю ошибку:

[root@ovm02 ~]# mount -t ocfs2 /dev/mapper/36001405efce93b538764a0f934a7f78c /OVS/Repositories
mount.ocfs2: Режим heartbeat недействителен при попытке присоединиться к группе

Попытка смонтировать /dev/sdd — возвращает тот же результат.

Состояния узлов абсолютно в порядке

[root@ovm02 ~]# service o2cb status
Драйвер для "configfs": Загружен
Файловая система "configfs": Смонтирована
Драйвер-склеивание стека: Загружен
Плагин стека "o2cb": Загружен
Драйвер для "ocfs2_dlmfs": Загружен
Файловая система "ocfs2_dlmfs": Смонтирована
Проверка кластера O2CB "95a828f93f00bd60": В сети
  Порог мертвого heartbeat: 61
  Тайм-аут неактивности сети: 60000
  Задержка keepalive сети: 2000
  Задержка повторного подключения к сети: 2000
  Режим heartbeat: Глобальный
Проверка heartbeat O2CB: Активен
  1E3ADD52196E4AF9B5565F4A9D9F93A4 /dev/dm-1
Узлы в кластере O2CB: 0 1 
Отладочный файловая система в /sys/kernel/debug: смонтирована

Версия OCFS2/OS/KERNEL
имя файла:       /lib/modules/3.8.13-26.4.2.el6uek.x86_64/kernel/fs/ocfs2/ocfs2.ko
лицензия:        GPL
автор:          Oracle
версия:        1.8.0
описание:       OCFS2 1.8.0
srcversion:     54320504732C88B1365858A
зависит от:     jbd2,ocfs2_stackglue,ocfs2_nodemanager
внутри дерева:  Y
vermagic:       3.8.13-26.4.2.el6uek.x86_64 SMP mod_unload modversions 

kernel-uek-firmware-3.8.13-26.4.2.el6uek.noarch
kernel-uek-3.8.13-26.4.2.el6uek.x86_64

ocfs2-tools-1.8.6-11.el6.x86_64
ocfs2-tools-devel-1.8.6-11.el6.x86_64

Я также не вижу никаких видимых проблем в выводе dmesg. Но ни перезагрузка, ни повторное создание файловой системы с любыми параметрами не дали эффекта. Google не выдал никаких подобных результатов. Буду признателен за любые идеи.

Ответ или решение

Ошибка монтирования OCFS2 с использованием iSCSI: "Режим сердцебиения недействителен при попытке присоединиться к группе"

При работе с кластером файловой системы OCFS2 может возникать ошибка, связанная с неверным режимом сердцебиения. Проблема, которую вы описали, известна и может быть вызвана несколькими факторами. Давайте рассмотрим возможные причины возникновения ошибки "Heartbeat mode is invalid while trying to join the group" и их решения.

Понимание проблемы

Кластер OCFS2 требует правильной настройки режимов сердцебиения для обеспечения надежной работы и синхронизации между узлами. В вашем случае, хотя статус узлов "в порядке", система не разрешает монтирование разделов, что может указывать на конфигурационные проблемы.

Возможные причины

  1. Неверный режим сердцебиения: На текущий момент, согласно статусу O2CB, режим сердцебиения установлен на "Global". Однако, система может ожидать другого значения.

  2. Проблемы с сетевыми настройками: Убедитесь, что сетевые настройки для кластерного управления корректны. Все узлы должны быть доступны друг другу без задержек.

  3. Версия программного обеспечения: Убедитесь, что версии ocfs2 и ocfs2-tools на всех узлах совпадают. Неконсистентные версии могут привести к проблемам совместимости.

  4. Неправильная настройка iSCSI: Проверьте, правильно ли настроены iSCSI-сессии и видны ли устройства на всех узлах. Убедитесь, что доступ к LUN-ам не блокируется.

  5. Заблокированные ресурсы: Иногда ошибки могут быть вызваны заблокированными ресурсами на одном из узлов. Проверьте состояние блокировок и освобождение ресурсов.

Шаги для устранения проблемы

  1. Проверка конфигурации O2CB: Убедитесь, что конфигурация O2CB корректна. Используйте команду:

    o2cb_ctl status

    Убедитесь, что режим сердцебиения действительно установлен на "Global", либо измените его:

    o2cb_ctl heartbeat_mode global
  2. Сброс режима сердцебиения: В некоторых случаях поможет сброс режима с очисткой и повторной инициализацией:

    service o2cb stop
    service o2cb start
  3. Проверка соединений iSCSI: Убедитесь, что устройство iSCSI доступно на обеих машинах. Используйте:

    iscsiadm -m session
  4. Проверка логов: Изучите системные логи (например, с помощью dmesg и journalctl), чтобы найти сообщения об ошибках, касающиеся OCFS2.

  5. Перемонтирование устройств: Попробуйте отмонтировать и повторно смонтировать устройства, убедившись перед этим, что все корректно настроено и доступно.

Заключение

Ошибки при работе с кластером OCFS2 могут возникать из-за множества причин, связанных как с настройками узлов, так и с конфигурацией оборудования. Внимательное изучение каждого аспекта, включая настройки iSCSI, версии программного обеспечения, и конфигурацию O2CB, поможет вам выявить и устранить проблему. Если после выполнения всех вышеперечисленных шагов ошибка все еще возникает, стоит обратиться в службу поддержки, которая сможет помочь с дальнейшей диагностикой проблемы.

Оцените материал
Добавить комментарий

Капча загружается...