Вопрос или проблема
У нас есть странная ситуация с некоторыми нашими серверами, где они, похоже, не могут завершить работу или перезагрузиться без ручного полного отключения питания.
Сначала я думал, что это просто разовая проблема, когда один из серверов не смог запуститься после обновления. Однако после исправления нашего расписания WSUS, это, похоже, происходит с тремя серверами постоянно, когда они перезагружаются или выключаются либо вручную, либо через что-то вроде обновления Windows.
- Все три сервера сконфигурированы идентично как файловые серверы
- Все три сервера – это физические серверы Dell R730 (и они еще на гарантии)
- Ни один из наших других серверов Dell или Windows 2012 R2 не имеет этой проблемы
Во время интерактивной сессии, которая вызвала завершение работы/перезагрузку, кажется, что она зависает на значке с вращающимся колесом с подписью «Выключение» или «Перезагрузка». Не похоже, что он на самом деле завис, и серверы все еще отвечают на запросы ping. Однако вы не можете удаленно подключиться к их журналам событий или инициировать сеанс удаленного рабочего стола. При попытке подключения через KVM вы просто видите экран блокировки 2012 R2, и он не реагирует на комбинацию Crtl+Alt+Delete (что изначально заставило меня подумать, что он, на самом деле, успешно перезагрузился, а затем завис.. хотя на самом деле он вообще не перезагрузился на этом этапе).
До сих пор я попробовал несколько вещей, которые, похоже, не изменили ситуацию:
- Я полностью обновил и улучшил прошивку, BIOS и драйверы на одном из серверов
- Я поэтапно обновил и улучшил те же элементы на другом сервере, перезагружая между каждым этапом, начиная с без обновлений и без улучшений
- Затем я попытался перезагрузить оба сервера – и выключить оба сервера
- Я оставил один сервер в том же состоянии (самый важный для нас на данный момент)
Поскольку все три сервера одного и того же модели, я изначально склонялся к тому, что это может быть проблема с физическими системами. Однако это не выглядит как задокументированная проблема R730, и поскольку все три являются файловыми серверами, мне интересно, может ли это быть проблема конфигурации дискового пула или что-то в этом роде?
Честно говоря, я не очень уверен, какой путь исследовать. Не знал, как лучше всего прикрепить журнал, но прикрепил изображение текста из системного журнала событий (снизу вверх). Я не вижу там ничего аномального или чего-то, указывающего на проблему (например, что кто-то выключил его вручную), и там говорится, что он выключается. Просто этого не произошло..
Любая помощь будет очень признательна – или если кто-то может предложить другие пути, которые я должен попробовать (Microsoft или Dell?)
Я решил эту проблему, исключив dat расширение в конфигурации дедупликации Windows для всех томов, на которых включена дедупликация Windows. Затем удалил файл ArcVolTrc.dat из всех томов, на которых включена дедупликация Windows. Перезагрузил агент arcserve UDP, чтобы воссоздать файл ArcVolTrc.dat.
После успешной перезагрузки сервера.
Ответ или решение
Проблема зависания серверов при выключении или перезагрузке на Windows Server 2012 R2
Существует несколько причин, по которым серверы могут зависать при выполнении операций выключения или перезагрузки. Рассмотрим методы диагностики и решения этой проблемы, а также различные аспекты, которые стоит учесть.
Возможные Причины Зависания
-
Обновления программного обеспечения: Ваша проблема может быть связана с обновлениями Windows или драйверами. Убедитесь, что все компоненты системы обновлены до последних версий. Особенно это касается обновлений для системы и программного обеспечения, используемого в ваших серверах.
-
Конфликты программного обеспечения: Некоторые приложения или службы могут блокировать процесс завершения работы. Попробуйте временно отключить службы, которые могут быть причиной проблемы.
-
Windows Deduplication: Доступная функция дедупликации в Windows Server может влиять на работу с дисками. Как вы упомянули, исключение определенных расширений файлов (например, .dat) из конфигурации дедупликации и удаление ArcVolTrc.dat может помочь решить проблему. Это связано с тем, что файлы дедупликации могут не управляться корректно, вызывая зависания.
-
Проблемы с оборудованием: Несмотря на то что ваши серверы находятся под гарантией, возможны аппаратные сбои. Проверьте системные логи и используйте инструменты Dell для диагностики оборудования.
-
Настройки BIOS и управления питанием: Неправильные настройки BIOS могут также вызвать зависание при выключении. Убедитесь, что настройки ACPI и управления питанием (если они доступны) настроены корректно.
Шаги по Устранению Проблемы
-
Проверка журналов событий: Просмотрите журнал событий Windows, чтобы выявить возможные ошибки. Ищите сообщения об ошибках в момент попытки выключения или перезагрузки.
-
Обновление прошивки и драйверов: Ваша первоначальная попытка обновить BIOS и драйвера была правильной. Убедитесь, что все компоненты (включая сетевые карты и контроллеры хранения) обновлены.
-
Тестирование без дедупликации: Временно отключите Windows Deduplication на ваших дисках и проверьте, будет ли проблема сохраняться.
-
Изучение конфигурации дисков: Проверьте настройкиRAID и параметры хранения (например, политики кэширования), так как они могут влиять на производительность и процессы завершения работы.
-
Тестирование на чистой установке: Если возможно, установите один из серверов заново, чтобы исключить влияние настроек или программного обеспечения.
Заключение
Проблема зависания серверов при выключении и перезагрузке на платформе Windows Server 2012 R2 может быть вызвана несколькими факторами, начиная от программных конфликтов и заканчивая возможными аппаратными неисправностями. Однако, как показал ваш случай, выключение дедупликации для файлов с расширением .dat могло решить проблему. Рекомендуется тщательно подходить к диагностике, обращать внимание на обновления и охранять целостность конфигурации системы для предотвращения подобных проблем в будущем.
Если решения, указанные выше, не помогут, не стесняйтесь обратиться к службе поддержки как Microsoft, так и Dell для более глубокого анализа и диагностики.