Настройка кластера отказоустойчивости Windows Server с Storage Spaces Direct на двух узлах EC2 для восстановления после полного отказа кластера.

Question 1

Работал над проектом с использованием S2D на двухузловом WSFC с файлообменным свидетелем на FSx, с узлами, размещенными на двух экземплярах EC2, работающих под управлением Windows Server 2022, каждый с объемом EBS. Автоматизация использует FailoverClusterDsc для настройки кластера и Enable-ClusterStorageSpacesDirect для включения S2D.

Все работает нормально. Кластер настраивается, и хранилище кластеризуется. Интересно, что после первого запуска Enable-ClusterStorageSpacesDirect второй том EBS исчезает, и у нас остается только один.

У нас есть дополнительная автоматизация для добавления узла в кластер, если один узел уничтожен, и это также работает.

Однако, пытаясь восстановить после одновременного уничтожения обоих узлов, мы сталкиваемся с проблемами.

Кластер недоступен, поэтому мы не можем присоединить новые узлы к существующему кластеру, но если мы удалим объекты AD и создадим новый кластер, все работает до тех пор, пока мы не запустим Enable-ClusterStorageSpacesDirect.

Он жалуется, что на узле 2 нет подходящих дисков. Единственное решение, которое я нашел, это уничтожить и воссоздать диски, но это, очевидно, теряет все данные и упускает смысл.

Есть ли способ запустить кластер с помощью PowerShell и файлообменного свидетеля, чтобы мы могли присоединить узлы и использовать существующее хранилище?

Или способ сделать так, чтобы новый кластер знал о существующем хранилище, которое теперь считает первичным пулом?

Кажется, должен быть способ восстановиться после полного отказа оборудования, который уничтожение приблизит, но не удалось найти информацию на Reddit, Stack Exchange или Microsoft docs.

Нам нужно иметь возможность восстановиться после такой аварийной ситуации и сделать узлы как можно более заменяемыми, но сохранить файлы, хранящиеся на S2D?

Я пытался найти способ сохранить кластер в сети только со свидетелем, кажется, это невозможно с файлообменным свидетелем. Невозможно дать свидетелю все голоса. Я пытался добавить хранилище S2D обратно в новый кластер, но оно просто определяется как первичный пул и не может быть кластеризовано так же.

Question 2

Растянутый кластер на основе S2D не поддерживается, даже с Windows Server 2025. Microsoft удалили эту функциональность вместе с обновленным, переписанным и значительно более быстрым стеком NVMe и инициатором NVMe/TCP прямо перед тем, как WS2025 достиг этапа GA, оставив растянутый кластер как функцию только для локального Azure.

https://learn.microsoft.com/en-us/azure/azure-local/concepts/stretched-clusters

Так что неудивительно, что вы сталкиваетесь с проблемами с этой настройкой в Windows Server 2022. Мое предложение — придерживаться чего-то известного и официально поддерживаемого. Например, Storage Replica встроена и полностью поддерживается для ваших нужд. Также стоит рассмотреть сторонние решения, их много!

Настройка кластера отказоустойчивости Windows Server с Storage Spaces Direct на двух узлах EC2 для восстановления после полного отказа кластера.

Вопрос или проблема

Ответ или решение

Теория

Пример

Применение