Вопрос или проблема
Моя компания использует Veeam Backup & Replication для резервного копирования наших виртуальных машин, размещенных на VMWare. Мы используем функцию резервного копирования журналов SQL для нашего сервера MS SQL 2008 R2. Наш репозиторий резервных копий находится на NAS Buffalo TeraStation TS-XLBF.
В какой-то момент мы начали получать отчеты об ошибках такого рода:
Не удалось сохранить файл резервной копии журнала транзакций для базы данных [название БД] в
репозиторий: Der angegebene Netzwerkname ist nicht mehr verfügbar.
Код ошибки: 64 Не удалось сбросить буферы файла. Файл: [путь к файлу .vlb]. Не удалось создать резервную копию
файла. Файл: [описание файла] Не удалось сохранить файл резервной копии журнала транзакций
для базы данных в репозиторий: Der angegebene Netzwerkname
ist nicht mehr verfügbar. Код ошибки: 64 Не удалось сбросить буферы файла.
Файл: [имя файла]. Не удалось создать резервную копию файла. Файл: [описание файла]
Журналы транзакций некоторых баз данных не были сохранены за последние
38 интервалов
Текст на немецком языке (Der angegebene Netzwerkname ist nicht mehr verfügbar) означает, Указанное сетевое имя больше не доступно.
Как оказалось, эта ошибка возникает каждый понедельник ночью в запланированное время для регулярных заданий резервного копирования. Сами резервные копии виртуальных машин завершаются успешно, затрагивается только резервное копирование журналов SQL.
Сообщения об ошибках отправляются каждые несколько минут, но прекращаются, как только мы перезагружаем систему, на которой работает Veeam. Ищу причину проблемы, я нашел статью на сайте Veeam, описывающую это сообщение об ошибке. В статье указываются проблемы с дедупликацией на NTFS-хранилище как основная причина. Поскольку TeraStation — это система Linux, использующая XFS, которая не поддерживает дедупликацию, я не думаю, что это применимо в нашем случае.
Я также пытался получить доступ к репозиторию резервных копий, используя путь, указанный в сообщении об ошибке, в то время как сообщения об ошибках все еще генерировались. Мне удалось получить доступ к ресурсу, так что, думаю, проблема не в разрешении имен.
Журналы событий на машине, работающей под управлением Veeam, не показывают никаких сообщений об ошибках. Регулярные резервные копии всех виртуальных машин выполняются без ошибок.
В чем может быть причина сбоев в задачах резервного копирования журнала сервера SQL? Есть ли способ собрать больше информации о сбое?
Запустите это в PowerShell
Set-SmbClientConfiguration -SessionTimeout 600
Это увеличивает таймаут для SMB подключения.
Ответ или решение
Когда возникает ошибка при резервном копировании журналов SQL в Veeam с сообщением "Failed to flush file buffers", необходимо тщательно проанализировать ситуацию, учитывая предоставленные данные и контекст. Ошибка сопровождается сообщением на немецком языке "Der angegebene Netzwerkname ist nicht mehr verfügbar", что переводится как "Указанное сетевое имя больше недоступно". Обычно это указывает на проблему с сетевым соединением между Veeam и хранилищем резервных копий, которым в данном случае служит Buffalo TeraStation на операционной системе Linux.
Возможные причины и решения
-
Проблемы с сетевым соединением:
Вероятнее всего, ошибка связана с непостоянством сетевого соединения к NAS. В предстоящем шаге стоит проверить стабильность сетевого подключения, обратить внимание на параметры конфигурации сети, особенно на временные интервалы (тайм-ауты) установленных соединений. -
Конфигурация SMB-сервера:
Поскольку TeraStation используется как NAS с файловой системой XFS, важно убедиться в корректной работе SMB-сервера. Попробуйте увеличить тайм-аут сессии SMB в PowerShell с помощью команды:Set-SmbClientConfiguration -SessionTimeout 600
Это увеличит время ожидания отклика от SMB-хранилища и может помочь избежать внезапного разрыва соединений.
-
Параллельная активность:
Следует обратить внимание, что ошибка возникает по понедельникам, в то время, когда выполняются обычные резервные копии. Это может указывать на параллельную нагрузку на сеть или устройство хранения, что приводит к его перегрузке. Попробуйте разнести по времени выполнение резервных копий VM и SQL логов. -
Диагностика и логирование:
Поскольку стандартные журналы не указывают на ошибки, рассмотрите возможность включения расширенного логирования в Veeam и на устройстве NAS. Это может предоставить дополнительные подробности о проблемах с соединением или производительностью. -
Альтернативы хранения:
Если проблема сохраняется, рассмотрите временное размещение резервных копий на другом устройстве для оценки воздействия сетевой и системной конфигурации Buffalo TeraStation на проблему.
Заключение
Каждое из предлагаемых решений требует детального исследования и тестирования, чтобы выяснить основную причину проблемы. Начните с анализа доступности сети и времени выполнения задач, это может значительно сузить сферу поиска проблемы. Важно также учитывать специфику настройки самого хранилища и его взаимодействие с сетью.
Создавая решение, старайтесь учитывать все аспекты и данные, предоставленные в описании проблемы, и использовать аналитический подход для диагноза и устранения диктуемых контекстом проблем.