Вопрос или проблема
Я планирую улучшить свою сетевую инфраструктуру.
В настоящее время она состоит из следующих элементов:
- HV – Dell PowerEdge R7525 с VMware
- старый HV в качестве резервного
- массивах – 2x QNAP TS-1279U-RP
- резервное копирование Veeam
В настоящее время, в случае сбоя HV, мне придется восстанавливать машины из резервной копии на резервный HV, что займет много времени, поэтому это парализует компанию на некоторое время, и я потеряю некоторые данные. Сбой массива не должен вызвать трагедию, так как он синхронизируется через RTRR, но я также могу потерять некоторые несинхронизированные данные.
Учитывая вышеизложенное, улучшение инфраструктуры направлено на поддержание работы систем в случае сбоя любого устройства, насколько это возможно.
Мое запланированное улучшение:
Моя инфраструктура после изменений будет состоять из следующих элементов:
- 2x HV Dell PowerEdge R7525 с VMware
- 2x коммутатор – Cisco C1300-12XS
- 2x массив – QNAP TS-h1886XU-RP
Конфигурация устройств с резервированием:
- HV – соединены в HA – когда один из них выходит из строя, другой должен автоматически включить виртуальные машины
- массивы – настроены на Active-Active iSCSI Target с синхронизацией в реальном времени, чтобы сбой любого из массивов не приводил к потере данных
- коммутаторы – объединены в стек, и когда один из них выходит из строя, другой берет на себя функции, а соединение устройств по схеме все еще позволяет всей системе работать. HV, благодаря настроенному Multipath I/O (MPIO), переключаются на все еще функционирующий, активный сетевой путь
Пожалуйста, оцените, как я это спланировал.
Это реалистичный, хороший план?
Я допускаю какие-либо ошибки в этом?
Можно ли сделать лучше / экономичнее?
.
Ответ или решение
Оценка сети с учетом отказоустойчивости
Планирование отказоустойчивой инфраструктуры требует тщательной оценки текущих компонентов сети и предстоящих изменений. Ваше текущее оборудование и схема работы присутствуют на достаточно высоком уровне, однако в ситуации с отказом виртуальных машин, как вы упомянули, существуют риски, которые стоит минимизировать. Рассмотрим ваш план более подробно.
1. Хост-системы (HV)
Вы предложили интеграцию двух серверов Dell PowerEdge R7525 с VMware с конфигурацией высокой доступности (HA). Это — правильное решение. HA в виртуализированных средах позволяет автоматизировать восстановление виртуальных машин на работающем сервере в случае сбоя. Для дополнительной надежности стоит учитывать следующие аспекты:
- Тестирование сценариев отказа: Необходимо регулярно проводить тесты на работу HA, чтобы убедиться, что система может успешно переключаться на резервный сервер.
- Настройка мониторинга: Включите системы мониторинга для оповещения вас в случае сбоев, что позволит провести профилактические меры еще до возникновения проблемы.
2. Системы хранения данных (Массивы)
Вы планируете использовать два массива QNAP TS-h1886XU-RP в режиме Active-Active с синхронизацией iSCSI целевых устройств в реальном времени. Это решение обеспечивает высокую доступность и защиту данных.
- Следует обратить внимание на полное резервное копирование: Несмотря на синхронизацию, важно иметь стратегию резервного копирования, которая включает в себя снятие образов и их хранение на другом носителе.
- Проверка производительности: Убедитесь, что пропускная способность сети и массива соответствует вашим ожиданиям при активной синхронизации.
3. Сетевое оборудование (Коммутаторы)
Запланированная конфигурация с двумя коммутаторами Cisco C1300-12XS в стеке— хорошая идея для обеспечения отказоустойчивости.
- Резервирование кабелей: Убедитесь, что у вас есть резервированные сетевые пути, используя несколько кабелей для подключения к каждому коммутатору. Это может значительно снизить риски разрывов связи.
4. Мультипортовая маршрутизация (MPIO)
Настройка MPIO для обеспечения отказоустойчивости на уровне сети – важный профессиональный совет:
- Эффективность MPIO: Проверяйте конфигурацию MPIO, чтобы убедиться, что она правильно настроена для работы со всеми вашими устройствами.
- Анализ производительности: После конфигурации MPIO проведите тесты нагрузки для выявления любых узких мест.
Заключение и рекомендации
Ваша планируемая модернизация сети представляется логичной и разумной. Основные аспекты, о которых необходимо помнить, это регулярное тестирование системы на сбои, наличие эффективных решений для резервного копирования и мониторинг полноценной работы всех узлов.
Подводя итог, можно утверждать, что предложенное вами решение не только крепко стоит на современных бизнес-принципах, но и полностью соответствует требованиям для построения отказоустойчивой инфраструктуры. Дополните свою архитектуру планом тестирования и внедрите регулярный контроль мониторинга для достижения максимальной доступности и защиты данных.