Вопрос или проблема
ВАЖНОЕ ЗАМЕЧАНИЕ: Мне больше не нужно перезагружать серверы (мои 3 VPS!), чтобы вернуть файл pid в каталог /run/nginx.pid
Я просто ввел команду: sudo fuser -k 443 /tcp && service nginx start
решает проблему на 24 часа, так как pid возвращается в /run/nginx/ без перезапуска службы, и всегда работает, но каждый день PID исчезает! даже если процесс nginx выполняется, и сервер всегда работает!
так что я могу использовать service nginx start, и pid возвращается, мониторинг nginx продолжается, и я снова получаю контроль над командами: service nginx status, service nginx stop и т.д…
Внимание, я не говорю, что nginx прекращает работу, сайты остаются онлайн, я говорю, что файл: /run/nginx.pid исчезает каждый день, поэтому я больше не могу использовать команды, связанные с nginx, даже когда я ввожу команду
sudo fuser -k 443/tcp
отсутствие файла /run/nginx.pid создает множество проблем, самая неприятная из которых заключается в том, что я не могу использовать команды service nginx status, start, stop и т.д…
=========================
Мне нужен pid nginx для работы с monit, pid просто исчезает неожиданно, и мне приходится перезапускать vps, чтобы вернуть его! это происходит каждую ночь! но даже если он исчезает, он все равно работает! сайт в сети! но, очевидно, я не могу следить за статусом, перезапускать, останавливать и т.д… мне нужен pid! когда я пытаюсь увидеть статус через терминал, у меня есть
Вывод ошибок в командной строке терминала:
service nginx status
● nginx.service - A high performance web server and a reverse proxy server
Loaded: loaded (/lib/systemd/system/nginx.service; enabled; vendor preset: en
Active: failed (Result: exit-code) since Sun 2017-11-05 06:25:07 WET; 1h 50mi
Process: 5062 ExecStop=/sbin/start-stop-daemon --quiet --stop --retry QUIT/5 -
Process: 1527 ExecStart=/usr/sbin/nginx -g daemon on; master_process on; (code
Process: 1522 ExecStartPre=/usr/sbin/nginx -t -q -g daemon on; master_process
Main PID: 1486 (code=exited, status=0/SUCCESS)
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 fail
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:80 faile
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 fail
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:80 faile
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 fail
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] still could not bind()
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Control process exited, code=exi
Nov 05 06:25:07 vps1 systemd[1]: Failed to start A high performance web server a
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Unit entered failed state.
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Failed with result 'exit-code'.
lines 1-18/18 (END)...skipping...
● nginx.service - A high performance web server and a reverse proxy server
Loaded: loaded (/lib/systemd/system/nginx.service; enabled; vendor preset: en
Active: failed (Result: exit-code) since Sun 2017-11-05 06:25:07 WET; 1h 50mi
Process: 5062 ExecStop=/sbin/start-stop-daemon --quiet --stop --retry QUIT/5 -
Process: 1527 ExecStart=/usr/sbin/nginx -g daemon on; master_process on; (code
Process: 1522 ExecStartPre=/usr/sbin/nginx -t -q -g daemon on; master_process
Main PID: 1486 (code=exited, status=0/SUCCESS)
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 fail
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:80 faile
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 fail
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:80 faile
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 fail
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] still could not bind()
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Control process exited, code=exi
Nov 05 06:25:07 vps1 systemd[1]: Failed to start A high performance web server a
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Unit entered failed state.
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Failed with result 'exit-code'.
~
~
~
~
~
~
lines 1-18/18 (END)...skipping...
● nginx.service - A high performance web server and a reverse proxy server
Loaded: loaded (/lib/systemd/system/nginx.service; enabled; vendor preset: enabled)
Active: failed (Result: exit-code) since Sun 2017-11-05 06:25:07 WET; 1h 50min ago
Process: 5062 ExecStop=/sbin/start-stop-daemon --quiet --stop --retry QUIT/5 --pidfile /run/nginx.pid (code=exited, status=1/FAILURE)
Process: 1527 ExecStart=/usr/sbin/nginx -g daemon on; master_process on; (code=exited, status=1/FAILURE)
Process: 1522 ExecStartPre=/usr/sbin/nginx -t -q -g daemon on; master_process on; (code=exited, status=0/SUCCESS)
Main PID: 1486 (code=exited, status=0/SUCCESS)
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 failed (98: Address already in use)
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:80 failed (98: Address already in use)
Nov 05 06:25:06 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 failed (98: Address already in use)
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:80 failed (98: Address already in use)
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] bind() to 141.14.14.41:443 failed (98: Address already in use)
Nov 05 06:25:07 vps1 nginx[1527]: nginx: [emerg] still could not bind()
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Control process exited, code=exited status=1
Nov 05 06:25:07 vps1 systemd[1]: Failed to start A high performance web server and a reverse proxy server.
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Unit entered failed state.
Nov 05 06:25:07 vps1 systemd[1]: nginx.service: Failed with result 'exit-code'.
мой /etc/nginx/nginx.conf:
user www-data;
worker_processes auto;
pid /run/nginx.pid;
events {
worker_connections 1024;
# multi_accept on;
}
http {
##
# Основные настройки
##
sendfile on;
tcp_nopush on;
tcp_nodelay on;
keepalive_timeout 65;
types_hash_max_size 2048;
# server_tokens off;
# server_names_hash_bucket_size 64;
# server_name_in_redirect off;
include /etc/nginx/mime.types;
default_type application/octet-stream;
##
# Настройки SSL
##
ssl_protocols TLSv1 TLSv1.1 TLSv1.2; # Отказ от SSLv3, ref: POODLE
ssl_prefer_server_ciphers on;
##
# Настройки ведения журнала
##
access_log /var/log/nginx/access.log;
error_log /var/log/nginx/error.log;
##
# Настройки Gzip
##
gzip on;
gzip_disable "msie6";
gzip_vary on;
gzip_proxied any;
gzip_comp_level 6;
gzip_buffers 16 8k;
gzip_http_version 1.1;
gzip_types text/plain text/css application/json application/javascript text/xml application/xml application/xml+rss text/javascript;
##
# Конфигурация виртуального хоста
##
include /etc/nginx/conf.d/*.conf;
include /etc/nginx/sites-enabled/*;
server_names_hash_bucket_size 128;
client_max_body_size 100M;
client_body_buffer_size 16k;
fastcgi_buffers 8 16k;
fastcgi_buffer_size 32k;
fastcgi_connect_timeout 180;
fastcgi_send_timeout 180;
fastcgi_read_timeout 180;
}
#mail {
# # См. пример сценария аутентификации на:
# # http://wiki.nginx.org/ImapAuthenticateWithApachePhpScript
#
# # auth_http localhost/auth.php;
# # pop3_capabilities "TOP" "USER";
# # imap_capabilities "IMAP4rev1" "UIDPLUS";
#
# server {
# listen localhost:110;
# protocol pop3;
# proxy on;
# }
#
# server {
# listen localhost:143;
# protocol imap;
# proxy on;
# }
#}
Лог Nginx:
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:25:08 [emerg] 1703#1703: still could not bind()
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:27:39 [emerg] 1978#1978: still could not bind()
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:30:10 [emerg] 2076#2076: still could not bind()
2017/11/05 06:32:41 [emerg] 2208#2208: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:32:41 [emerg] 2208#2208: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:32:41 [emerg] 2208#2208: bind() to 141.14.14.41:80 failed (98: Address already in use)
2017/11/05 06:32:41 [emerg] 2208#2208: bind() to 141.14.14.41:443 failed (98: Address already in use)
2017/11/05 06:32:41 [emerg] 2208#2208: bind() to 141.14.14.41:80 failed (98: Address already in use)
Ubuntu 16.04-64b / nginx 1.10.3 / php7.0-fpm
Я просто пытаюсь увидеть статус: service nginx status:
nginx.service - A high performance web server and a reverse proxy server
Loaded: loaded (/lib/systemd/system/nginx.service; enabled; vendor preset: enabled)
Active: failed (Result: exit-code) since Sun 2017-11-05 09:00:51 WET; 3h 5min ago
Process: 5062 ExecStop=/sbin/start-stop-daemon --quiet --stop --retry QUIT/5 --pidfile /run/nginx.pid (code=exited, status=1/FAILURE)
Process: 8636 ExecStart=/usr/sbin/nginx -g daemon on; master_process on; (code=exited, status=1/FAILURE)
Process: 8633 ExecStartPre=/usr/sbin/nginx -t -q -g daemon on; master_process on; (code=exited, status=0/SUCCESS)
Main PID: 1486 (code=exited, status=0/SUCCESS)
Nov 05 09:00:50 vps1 nginx[8636]: nginx: [emerg] bind() to 141.14.14.41:443 failed (98: Address already in use)
Nov 05 09:00:50 vps1 nginx[8636]: nginx: [emerg] bind() to 141.14.14.41:80 failed (98: Address already in use)
Nov 05 09:00:50 vps1 nginx[8636]: nginx: [emerg] bind() to 141.14.14.41:443 failed (98: Address already in use)
Nov 05 09:00:51 vps1 nginx[8636]: nginx: [emerg] bind() to 141.14.14.41:80 failed (98: Address already in use)
Nov 05 09:00:51 vps1 nginx[8636]: nginx: [emerg] bind() to 141.14.14.41:443 failed (98: Address already in use)
Nov 05 09:00:51 vps1 nginx[8636]: nginx: [emerg] still could not bind()
Nov 05 09:00:51 vps1 systemd[1]: nginx.service: Control process exited, code=exited status=1
Nov 05 09:00:51 vps1 systemd[1]: Failed to start A high performance web server and a reverse proxy server.
Nov 05 09:00:51 vps1 systemd[1]: nginx.service: Unit entered failed state.
Nov 05 09:00:51 vps1 systemd[1]: nginx.service: Failed with result 'exit-code'.
Если я перезагрузи сервер принудительно, reboot now (я только что сделал это снова), pid nginx снова появляется (/run/nginx.pid), и monit возвращается к мониторингу процесса:
https://i.sstatic.net/lvuA5.jpg
но, конечно, никто не может перезагружать vps только для того, чтобы сделать nginx status или nginx restart, потому что на сервере Linux больше нет nginx pid!
Я действительно ценю вашу помощь.
Первая попытка: pkill nginx && service nginx restart
Если файл все еще удаляется, вы можете использовать ftrace
чтобы найти, какой процесс удаляет ваш файл:
trace-cmd record -e \*unlink\*
Подождите, пока файл будет удален, нажмите CTRL+C, чтобы остановить trace-cmd record …, затем выполните:
trace-cmd report
См. также: https://serverfault.com/a/310477/30946
Также убедитесь, что pid в файлах /usr/lib/systemd/system/nginx.service
или /etc/systemd/system/nginx.service
указывает на тот же файл, что и в /etc/nginx/nginx.conf
.
Ответ или решение
Исчезновение файла /run/nginx.pid
каждый день является серьезной проблемой для вашей инфраструктуры, поскольку это препятствует использованию стандартных команд для управления сервисом nginx, а также затрудняет мониторинг с помощью инструментов типа Monit. Рассмотрим возможные причины и решения этой проблемы.
Причины исчезновения файла /run/nginx.pid
-
Конфликт портов: Судя по логам, у вас возникают ошибки при попытке привязки к портам 80 и 443: "Address already in use". Это указывает на то, что какой-то другой процесс использует эти порты. В вашем случае команда
sudo fuser -k 443 /tcp
убивает процессы, использующие этот порт, что временно решает проблему. -
Конфигурация системных сервисов: Убедитесь, что все файлы конфигурации согласованы. Проверьте, что
pid
в файлах/usr/lib/systemd/system/nginx.service
или/etc/systemd/system/nginx.service
указывает на тот же файл, что и в/etc/nginx/nginx.conf
. -
Проблемы с правами доступа: Проверьте, есть ли у процесса nginx нужные права для записи файла pid в директорию
/run
. -
Другие процессы или планировщик задач: Возможно, какой-то системный процесс или задача удаляет файл pid. Для диагностики используйте инструмент
trace-cmd
для отслеживания событий unlink, чтобы выяснить, какой процесс удаляет файл.
Решения и рекомендации
-
Диагностика с помощью
ftrace
: Используйтеtrace-cmd
для отслеживания, кто удаляет файл pid.trace-cmd record -e \*unlink\*
После исчезновения файла остановите запись и отобразите отчет:
trace-cmd report
-
Проверка и исправление конфигураций:
- Проверьте конфигурацию всех релевантных сервисов и убедитесь в согласованности путей файлов pid.
- Убедитесь, что порты 80 и 443 не используются другими сервисами. Для этого вы можете временно запустить команду
netstat
илиss
для выявления активных сокетов.
-
Мониторинг и планировщик заданий: Проверьте, нет ли конфликтующих задач в cron или других автоматизированных системах, которые могли бы вызывать перезапуск или изменение конфигурации nginx.
-
Обновите софт: Поскольку вы используете устаревшие версии Ubuntu 16.04 и nginx 1.10.3, рассмотреть обновление до более современных и поддерживаемых версий, что может решить некоторые скрытые проблемы безопасности и совместимости.
Эти шаги помогут вам устранить проблему с исчезновением файла pid, что обеспечит бесперебойную работу вашего веб-сервера и его мониторинг.