Вопрос или проблема
У меня есть кластер ceph, управляемый cephadm, состоящий из 2 узлов.
Когда я пытаюсь добавить третий узел, cephadm сообщает, что это было успешно:
main@node01:~$ sudo ceph orch host add node03 10.0.0.155
Добавлен узел 'node03' с адресом '10.0.0.155'
Однако проверка кластера показывает, что это не так:
main@node01:~$ sudo ceph node ls
{
"mon": {
"node01": [
"node01"
],
"node02": [
"node02"
]
},
"osd": {},
"mgr": {
"node01": [
"node01.gnxkpe"
],
"node02": [
"node02.tdjwgc"
]
}
}
Ответ или решение
При добавлении узла в кластер Ceph может возникать ситуация, когда команда сообщает о успешном добавлении, однако новый узел не отображается в списке узлов кластера. Давайте разберем, что может вызывать такую проблему и как ее решить.
1. Проверка состояния кластера Ceph
Первым шагом необходимо убедиться, что кластер работает нормально. Для этого выполните команду:
sudo ceph status
Проверьте, нет ли ошибок или предупреждений в статусе кластера. Обратите внимание на состояние мониторов (MON), хранилищ (OSD) и менеджеров (MGR).
2. Проверка доступа
Убедитесь, что ваш новый узел (node03) может обращаться к существующим узлам (node01 и node02). Попробуйте выполнить команду пинга с другого узла:
ping 10.0.0.155
Также проверьте, что на новом узле корректно настроены конфигурации сети и что он имеет доступ к портам, необходимым для работы Ceph.
3. Конфигурация ceph.conf
После добавления узла убедитесь, что файл конфигурации ceph.conf
на каждом узле актуален. Убедитесь, что IP-адреса и имена хостов правильно указаны. Проверьте наличие раздела, касающегося нового узла.
4. Целостность системы
Убедитесь, что на новом узле запущены все необходимые службы и что они находятся в рабочем состоянии. Запустите команду:
sudo ceph orch ps
Эта команда покажет, какие службы работают в кластере. Если служба для нового узла не отображается, возможно, она не была запущена.
5. Повторная попытка добавления узла
Если после всех проверок узел по-прежнему не отображается в кластере, попробуйте удалить его и снова добавить:
sudo ceph orch host rm node03
sudo ceph orch host add node03 10.0.0.155
6. Логи и отладка
Если проблема остается неразрешенной, проверьте логи Ceph на предмет ошибок. Логи можно найти в каталоге /var/log/ceph/
. Логи мониторов, OSD и менеджеров могут предоставить полезную информацию о том, что пошло не так.
Заключение
Управление кластером Ceph может представлять собой сложную задачу, особенно при добавлении новых узлов. Следование указанным шагам поможет вам диагностировать и устранить проблемы, связанные с добавлением узлов. Регулярно проверяйте состояние вашего кластера и убедитесь, что все узлы корректно интегрированы. Если после выполнения всех шагов проблема не исчезает, возможно, стоит обратиться за помощью к сообществу или технической поддержке Ceph.
Надеюсь, эти рекомендации помогут вам успешно добавить новый узел и обеспечить стабильную работу вашего кластера Ceph!