Планирование сетевой инфраструктуры с резервированием

Вопрос или проблема

Я планирую улучшить свою сетевую инфраструктуру.

В настоящее время она состоит из следующих элементов:

  • HV – Dell PowerEdge R7525 с VMware
  • старый HV в качестве резервного
  • массивах – 2x QNAP TS-1279U-RP
  • резервное копирование Veeam

В настоящее время, в случае сбоя HV, мне придется восстанавливать машины из резервной копии на резервный HV, что займет много времени, поэтому это парализует компанию на некоторое время, и я потеряю некоторые данные. Сбой массива не должен вызвать трагедию, так как он синхронизируется через RTRR, но я также могу потерять некоторые несинхронизированные данные.

Учитывая вышеизложенное, улучшение инфраструктуры направлено на поддержание работы систем в случае сбоя любого устройства, насколько это возможно.

Мое запланированное улучшение:

Моя инфраструктура после изменений будет состоять из следующих элементов:

  • 2x HV Dell PowerEdge R7525 с VMware
  • 2x коммутатор – Cisco C1300-12XS
  • 2x массив – QNAP TS-h1886XU-RP

Конфигурация устройств с резервированием:

  • HV – соединены в HA – когда один из них выходит из строя, другой должен автоматически включить виртуальные машины
  • массивы – настроены на Active-Active iSCSI Target с синхронизацией в реальном времени, чтобы сбой любого из массивов не приводил к потере данных
  • коммутаторы – объединены в стек, и когда один из них выходит из строя, другой берет на себя функции, а соединение устройств по схеме все еще позволяет всей системе работать. HV, благодаря настроенному Multipath I/O (MPIO), переключаются на все еще функционирующий, активный сетевой путь

введите описание изображения здесь

Пожалуйста, оцените, как я это спланировал.

Это реалистичный, хороший план?

Я допускаю какие-либо ошибки в этом?

Можно ли сделать лучше / экономичнее?

.

Ответ или решение

Оценка сети с учетом отказоустойчивости

Планирование отказоустойчивой инфраструктуры требует тщательной оценки текущих компонентов сети и предстоящих изменений. Ваше текущее оборудование и схема работы присутствуют на достаточно высоком уровне, однако в ситуации с отказом виртуальных машин, как вы упомянули, существуют риски, которые стоит минимизировать. Рассмотрим ваш план более подробно.

1. Хост-системы (HV)

Вы предложили интеграцию двух серверов Dell PowerEdge R7525 с VMware с конфигурацией высокой доступности (HA). Это — правильное решение. HA в виртуализированных средах позволяет автоматизировать восстановление виртуальных машин на работающем сервере в случае сбоя. Для дополнительной надежности стоит учитывать следующие аспекты:

  • Тестирование сценариев отказа: Необходимо регулярно проводить тесты на работу HA, чтобы убедиться, что система может успешно переключаться на резервный сервер.
  • Настройка мониторинга: Включите системы мониторинга для оповещения вас в случае сбоев, что позволит провести профилактические меры еще до возникновения проблемы.

2. Системы хранения данных (Массивы)

Вы планируете использовать два массива QNAP TS-h1886XU-RP в режиме Active-Active с синхронизацией iSCSI целевых устройств в реальном времени. Это решение обеспечивает высокую доступность и защиту данных.

  • Следует обратить внимание на полное резервное копирование: Несмотря на синхронизацию, важно иметь стратегию резервного копирования, которая включает в себя снятие образов и их хранение на другом носителе.
  • Проверка производительности: Убедитесь, что пропускная способность сети и массива соответствует вашим ожиданиям при активной синхронизации.

3. Сетевое оборудование (Коммутаторы)

Запланированная конфигурация с двумя коммутаторами Cisco C1300-12XS в стеке— хорошая идея для обеспечения отказоустойчивости.

  • Резервирование кабелей: Убедитесь, что у вас есть резервированные сетевые пути, используя несколько кабелей для подключения к каждому коммутатору. Это может значительно снизить риски разрывов связи.

4. Мультипортовая маршрутизация (MPIO)

Настройка MPIO для обеспечения отказоустойчивости на уровне сети – важный профессиональный совет:

  • Эффективность MPIO: Проверяйте конфигурацию MPIO, чтобы убедиться, что она правильно настроена для работы со всеми вашими устройствами.
  • Анализ производительности: После конфигурации MPIO проведите тесты нагрузки для выявления любых узких мест.

Заключение и рекомендации

Ваша планируемая модернизация сети представляется логичной и разумной. Основные аспекты, о которых необходимо помнить, это регулярное тестирование системы на сбои, наличие эффективных решений для резервного копирования и мониторинг полноценной работы всех узлов.

Подводя итог, можно утверждать, что предложенное вами решение не только крепко стоит на современных бизнес-принципах, но и полностью соответствует требованиям для построения отказоустойчивой инфраструктуры. Дополните свою архитектуру планом тестирования и внедрите регулярный контроль мониторинга для достижения максимальной доступности и защиты данных.

Оцените материал
Добавить комментарий

Капча загружается...