ceph говорит, что хост добавлен, но это не так.

Вопрос или проблема

У меня есть кластер ceph, управляемый cephadm, состоящий из 2 узлов.
Когда я пытаюсь добавить третий узел, cephadm сообщает, что это было успешно:

main@node01:~$ sudo ceph orch host add node03 10.0.0.155
Добавлен узел 'node03' с адресом '10.0.0.155'

Однако проверка кластера показывает, что это не так:

main@node01:~$ sudo ceph node ls
{
    "mon": {
        "node01": [
            "node01"
        ],
        "node02": [
            "node02"
        ]
    },
    "osd": {},
    "mgr": {
        "node01": [
            "node01.gnxkpe"
        ],
        "node02": [
            "node02.tdjwgc"
        ]
    }
}

Ответ или решение

При добавлении узла в кластер Ceph может возникать ситуация, когда команда сообщает о успешном добавлении, однако новый узел не отображается в списке узлов кластера. Давайте разберем, что может вызывать такую проблему и как ее решить.

1. Проверка состояния кластера Ceph

Первым шагом необходимо убедиться, что кластер работает нормально. Для этого выполните команду:

sudo ceph status

Проверьте, нет ли ошибок или предупреждений в статусе кластера. Обратите внимание на состояние мониторов (MON), хранилищ (OSD) и менеджеров (MGR).

2. Проверка доступа

Убедитесь, что ваш новый узел (node03) может обращаться к существующим узлам (node01 и node02). Попробуйте выполнить команду пинга с другого узла:

ping 10.0.0.155

Также проверьте, что на новом узле корректно настроены конфигурации сети и что он имеет доступ к портам, необходимым для работы Ceph.

3. Конфигурация ceph.conf

После добавления узла убедитесь, что файл конфигурации ceph.conf на каждом узле актуален. Убедитесь, что IP-адреса и имена хостов правильно указаны. Проверьте наличие раздела, касающегося нового узла.

4. Целостность системы

Убедитесь, что на новом узле запущены все необходимые службы и что они находятся в рабочем состоянии. Запустите команду:

sudo ceph orch ps

Эта команда покажет, какие службы работают в кластере. Если служба для нового узла не отображается, возможно, она не была запущена.

5. Повторная попытка добавления узла

Если после всех проверок узел по-прежнему не отображается в кластере, попробуйте удалить его и снова добавить:

sudo ceph orch host rm node03
sudo ceph orch host add node03 10.0.0.155

6. Логи и отладка

Если проблема остается неразрешенной, проверьте логи Ceph на предмет ошибок. Логи можно найти в каталоге /var/log/ceph/. Логи мониторов, OSD и менеджеров могут предоставить полезную информацию о том, что пошло не так.

Заключение

Управление кластером Ceph может представлять собой сложную задачу, особенно при добавлении новых узлов. Следование указанным шагам поможет вам диагностировать и устранить проблемы, связанные с добавлением узлов. Регулярно проверяйте состояние вашего кластера и убедитесь, что все узлы корректно интегрированы. Если после выполнения всех шагов проблема не исчезает, возможно, стоит обратиться за помощью к сообществу или технической поддержке Ceph.

Надеюсь, эти рекомендации помогут вам успешно добавить новый узел и обеспечить стабильную работу вашего кластера Ceph!

Оцените материал
Добавить комментарий

Капча загружается...