Создание масштабируемого резервного кластера с одним интерфейсом и сохранением данных

Question 1

В настоящее время я управляю рядом резервных серверов для резервного копирования других серверов, например, b01, b02, .., bn, все со своими IP, работающие со своими собственными FTP / SSH сервисами. Однако я хотел бы создать всего один интерфейс для хранения и извлечения резервных копий, облегчая процесс для себя и клиентов, подключаясь всегда к одному и тому же хосту, в то время как фактические данные хранятся на множестве серверов в бек-энде, а также улучшить масштабируемость системы.

В настоящее время я использую ZFS с снимками (и сжатием/дедупликацией) для хранения резервных копий, каждый сервер, который резервируется, имеет свой собственный том (20-500G) на сервере резервного копирования ZFS, который создается каждый день для сохранения.

Существует ли программа или техника, чтобы смонтировать/симулировать директорию с другого (резервного) сервера на входящее FTP / SSH соединение к “серверу соединения”? Она должна быть масштабируемой и, если возможно, избыточной, мне не удалось найти что-либо подобное.

Я также открыт для других решений и полного изменения текущей настройки резервного копирования, но есть некоторые требования:

Снимки резервных копий для сохранения, хранение только различий
FTP / SSH (rsync) доступ
Если возможно, применять некоторое сжатие и/или дедупликацию для экономии дискового пространства
Масштабируемость до сотен ТБ
Высокая производительность
Избыточность

Я исследовал возможность использования хранилища объектов, например, Openstack Swift, но создание снимков невозможно.

Поэтому мой вопрос заключается в том, как я могу достичь своей цели создания некоторого рода кластера резервного копирования с одним интерфейсом для замены текущей установки, состоящей из отдельных серверов.

Question 2

Не уверен, является ли это именно тем, что вы ищете, но, по сути, похоже, что вы ищете распределенную файловую систему.
Существуют несколько таких продуктов, начиная с drbd, через ceph, lustre и gluster. Я уверен, что их больше.
Из-за существующей инфраструктуры ZFS я бы посоветовал либо lustre (см. также zol ), либо любую распределенную файловую систему, которая позволяет использовать другую файловую систему поверх ее.

Lustre имеет недостаток в том, что она в первую очередь разработана для hpc scratch данных – это означает высокую производительность, низконадежное хранилище, и поэтому она не оптимизирована как решение для резервного копирования.

Ceph может быть лучшим решением для ваших нужд, но ее поддержка zfs все еще недостаточна.

Тем не менее, ¯- я бы посоветовал обратить внимание на gluster, который имеет поддержку сообщества для такой настройки, хотя их вариант – gluster поверх zfs (что означает, что снимки находятся на уровне отдельных пулов, вместо уровня пространства имен файловой системы).

Я бы все же не рекомендовал использовать drbd для чего-либо критически важного, но если ваши данные дополнительно резервируются (например, на ленту), то drbd над/под zfs может быть жизнеспособным решением также.

drbd поверх zfs, вероятно, достаточно безопасен, но вы все равно теряете глобальные снимки пространства имен.

Создание масштабируемого резервного кластера с одним интерфейсом и сохранением данных

Вопрос или проблема

Ответ или решение