Как автоматически перезапустить Nginx, когда он выходит из строя

Question 1

Я развернул свое приложение на AWS EC2 и хочу реализовать автоматизацию, при которой, если я перезапускаю мой инстанс или если веб-сервер Nginx не работает, он перезапустится автоматически. Я не очень знаю, с чего начать.

Слышал, что могу использовать crontab для создания расписания автоматического мониторинга, и если сервер не работает, можно отправлять уведомления на электронную почту и перезапускать веб-сервер.

Question 2

Используйте monit, которая предназначена для решения таких ситуаций.

apt install monit

nano /etc/monit/conf.d/nginx.conf

Поместите нижеуказанный контент в этот файл и перезапустите monit

check process nginx with pidfile /var/run/nginx.pid
start program = "/usr/sbin/service nginx start"
stop program = "/usr/sbin/service nginx stop"

Question 3

Это функция SystemD. Переопределите существующий файл unit для NGINX, выполнив systemctl edit nginx, затем вставьте:

[Service]
Restart=always

Сохраните.

Если NGINX завершает работу из-за, например, OOM killer, он будет перезапущен после сбоя.
Если в NGINX есть ошибка конфигурации, он, конечно, не будет перезапущен.

Чтобы проверить эту конфигурацию, запустите сервис NGINX с помощью systemctl start nginx и проверьте, что он работает, с помощью systemctl status nginx.

Убейте его с помощью pkill -f nginx. Подтвердите, что NGINX все еще работает, с помощью systemctl status nginx.

Question 4

Это фактически довольно просто.

Перейдите в /lib/systemd/system

Создайте резервную копию системного блока nginx (на всякий случай) с помощью sudo cp nginx.service nginx.service.old

Добавьте следующие 2 строки в конец блока [Service] в nginx.service

Restart=on-failure
RestartSec=5s

Загрузите новую конфигурацию с помощью sudo systemctl daemon-reload

Для теста попробуем убить nginx

cat /var/run/nginx.pid даст вам PID

sudo kill -9 PID убьет nginx

Вы заметите, что если проверить PID, то он будет другим. Если бы вы не запускали эти строки, убийство nginx привело бы к остановке сервера. Это только вызовет перезапуск при незапланированном завершении работы

Question 5

У вас уже есть много ответов о том, как это сделать, но я бы изучил, что происходит, чтобы он выключался в первую очередь, и исправил это.

Когда nginx выходит из строя, все текущие запросы будут завершены в неизвестном состоянии — файлы наполовину переданы, вызовы API не отвечены. В принципе, приложение, работающее поверх, должно справляться с этим, на практике это редко бывает так, но на этом уровне это проявится как странное и невоспроизводимое поведение, давая людям, использующим сервис, чувство нестабильности (и вполне обоснованно).

Question 6

Если вы хотите перезапустить процесс, как вы указали в заголовке вопроса, все остальные ответы кажутся отличными. Если вы хотите перезапустить инстанс, как вы сказали в тексте вопроса, вы можете использовать Auto Scaling Group.

Настройте Auto Scaling Group с минимальным и максимальным числом в 1 инстанс и укажите проверку состояния на контент, обслуживаемый вашим веб-сервером Nginx (желательно что-то, что не потребляет много CPU, например, robots.txt). Auto Scaling Group обнаружит, когда инстанс не в порядке (может потребоваться 3 или 5 сбоев проверки состояния) и убьет инстанс и запустит новый.

Имейте в виду, что вы потеряете все состояние, сохраненное в инстансе (поскольку инстанс на самом деле уничтожается). Сохранение состояния внутри сервера — это анти-паттерн в облаках. Вы также потеряете кеши.

Question 7

Попробовал использовать systemctl edit nginx и вставил эти строки:

RestartSec=5s

Но возникла эта ошибка, и когда nginx завершает работу, он не перезапускается
/etc/systemd/system/nginx.service.d/override.conf:1: Assignment outside of section. Ignoring.

Question 8

Автоматический перезапуск при авариях для Nginx на обоих продакшн серверах, сервере для тестирования и сервере разработки. Имена серверов:

dev staging prod

Я изменил “/lib/systemd/system/nginx.service” и добавил следующую строку в раздел [Service] в конце -> Restart=on-failure

после изменения конфигурации мы должны выполнить команду ‘systemctl daemon-reload‘ чтобы настройка авто-перезапуска вступила в силу.

Это должно перезапускать Nginx при его сбое

Question 9

Если ваша дистрибуция основана на systemd, вы можете использовать пример скрипта как этот, чтобы запустить демон, если он не запущен/умер

#!/bin/bash
systemctl is-active nginx
if [ "$?" -ne 0 ]
then systemctl start nginx
mail....... #send some mail
fi

запись в cron должна быть примерно такой

*/5 * * * * /path/to/the/script

И это должно выполняться от имени root (root cron)

Как автоматически перезапустить Nginx, когда он выходит из строя

Вопрос или проблема

Ответ или решение

Теория

Пример

Использование `monit`

Конфигурация `systemd`

Авто Масштабируемость

Применение

Как автоматически перезапустить Nginx, когда он выходит из строя

Вопрос или проблема

Ответ или решение

Теория

Пример

Использование monit

Конфигурация systemd

Авто Масштабируемость

Применение

Использование `monit`

Конфигурация `systemd`