Вопрос или проблема
Кластер OCFS2 с двумя узлами пытается работать с хранилищем, имеющим два блочных устройства. Эти устройства共享ся через iSCSI и видимы на обоих узлах. Меньший диск (230 Гб) используется дляheartbeat, больший (5,5 Тб) – для хранения. Однако, если я пытаюсь смонтировать устройство или mpath устройства, я получаю ошибку:
[root@ovm02 ~]# mount -t ocfs2 /dev/mapper/36001405efce93b538764a0f934a7f78c /OVS/Repositories
mount.ocfs2: Режим heartbeat недействителен при попытке присоединиться к группе
Попытка смонтировать /dev/sdd — возвращает тот же результат.
Состояния узлов абсолютно в порядке
[root@ovm02 ~]# service o2cb status
Драйвер для "configfs": Загружен
Файловая система "configfs": Смонтирована
Драйвер-склеивание стека: Загружен
Плагин стека "o2cb": Загружен
Драйвер для "ocfs2_dlmfs": Загружен
Файловая система "ocfs2_dlmfs": Смонтирована
Проверка кластера O2CB "95a828f93f00bd60": В сети
Порог мертвого heartbeat: 61
Тайм-аут неактивности сети: 60000
Задержка keepalive сети: 2000
Задержка повторного подключения к сети: 2000
Режим heartbeat: Глобальный
Проверка heartbeat O2CB: Активен
1E3ADD52196E4AF9B5565F4A9D9F93A4 /dev/dm-1
Узлы в кластере O2CB: 0 1
Отладочный файловая система в /sys/kernel/debug: смонтирована
Версия OCFS2/OS/KERNEL
имя файла: /lib/modules/3.8.13-26.4.2.el6uek.x86_64/kernel/fs/ocfs2/ocfs2.ko
лицензия: GPL
автор: Oracle
версия: 1.8.0
описание: OCFS2 1.8.0
srcversion: 54320504732C88B1365858A
зависит от: jbd2,ocfs2_stackglue,ocfs2_nodemanager
внутри дерева: Y
vermagic: 3.8.13-26.4.2.el6uek.x86_64 SMP mod_unload modversions
kernel-uek-firmware-3.8.13-26.4.2.el6uek.noarch
kernel-uek-3.8.13-26.4.2.el6uek.x86_64
ocfs2-tools-1.8.6-11.el6.x86_64
ocfs2-tools-devel-1.8.6-11.el6.x86_64
Я также не вижу никаких видимых проблем в выводе dmesg. Но ни перезагрузка, ни повторное создание файловой системы с любыми параметрами не дали эффекта. Google не выдал никаких подобных результатов. Буду признателен за любые идеи.
Ответ или решение
Ошибка монтирования OCFS2 с использованием iSCSI: "Режим сердцебиения недействителен при попытке присоединиться к группе"
При работе с кластером файловой системы OCFS2 может возникать ошибка, связанная с неверным режимом сердцебиения. Проблема, которую вы описали, известна и может быть вызвана несколькими факторами. Давайте рассмотрим возможные причины возникновения ошибки "Heartbeat mode is invalid while trying to join the group" и их решения.
Понимание проблемы
Кластер OCFS2 требует правильной настройки режимов сердцебиения для обеспечения надежной работы и синхронизации между узлами. В вашем случае, хотя статус узлов "в порядке", система не разрешает монтирование разделов, что может указывать на конфигурационные проблемы.
Возможные причины
-
Неверный режим сердцебиения: На текущий момент, согласно статусу O2CB, режим сердцебиения установлен на "Global". Однако, система может ожидать другого значения.
-
Проблемы с сетевыми настройками: Убедитесь, что сетевые настройки для кластерного управления корректны. Все узлы должны быть доступны друг другу без задержек.
-
Версия программного обеспечения: Убедитесь, что версии
ocfs2
иocfs2-tools
на всех узлах совпадают. Неконсистентные версии могут привести к проблемам совместимости. -
Неправильная настройка iSCSI: Проверьте, правильно ли настроены iSCSI-сессии и видны ли устройства на всех узлах. Убедитесь, что доступ к LUN-ам не блокируется.
-
Заблокированные ресурсы: Иногда ошибки могут быть вызваны заблокированными ресурсами на одном из узлов. Проверьте состояние блокировок и освобождение ресурсов.
Шаги для устранения проблемы
-
Проверка конфигурации O2CB: Убедитесь, что конфигурация O2CB корректна. Используйте команду:
o2cb_ctl status
Убедитесь, что режим сердцебиения действительно установлен на "Global", либо измените его:
o2cb_ctl heartbeat_mode global
-
Сброс режима сердцебиения: В некоторых случаях поможет сброс режима с очисткой и повторной инициализацией:
service o2cb stop service o2cb start
-
Проверка соединений iSCSI: Убедитесь, что устройство iSCSI доступно на обеих машинах. Используйте:
iscsiadm -m session
-
Проверка логов: Изучите системные логи (например, с помощью
dmesg
иjournalctl
), чтобы найти сообщения об ошибках, касающиеся OCFS2. -
Перемонтирование устройств: Попробуйте отмонтировать и повторно смонтировать устройства, убедившись перед этим, что все корректно настроено и доступно.
Заключение
Ошибки при работе с кластером OCFS2 могут возникать из-за множества причин, связанных как с настройками узлов, так и с конфигурацией оборудования. Внимательное изучение каждого аспекта, включая настройки iSCSI, версии программного обеспечения, и конфигурацию O2CB, поможет вам выявить и устранить проблему. Если после выполнения всех вышеперечисленных шагов ошибка все еще возникает, стоит обратиться в службу поддержки, которая сможет помочь с дальнейшей диагностикой проблемы.