Совместное использование исходного порта TCP

Question 1

Мое понимание TCP-соединения заключается в том, что исходный ПОРТ остается эксклюзивным для одного соединения, независимо от назначения, так что количество соединений с локального порта 12345, например, не может превышать 1.

Недавно я прочитал, что TCP-соединение идентифицируется по <исходный IP, исходный ПОРТ, целевой IP, целевой ПОРТ>

TCP позволяет совместное использование исходного порта несколькими процессами, но каждый процесс требует свободного порта для закрепления соединения

Поэтому я решил проверить, что такое “совместное использование порта между процессами”: это должно означать, что один и тот же исходный порт может использоваться для подключения к различным назначениям.

Однако, экспериментируя с этим, я попробовал эти две команды:

nc -v -p 12345 google.com 80

которая работает хорошо (опция -v для подробного вывода, и -p для указания исходного порта как 12345, для целей обучения)

Теперь одновременно запустив эту команду в другом окне терминала

nc -v -p 12345 github.com 80

появляется ошибка:

nc: connectx to github.com port 80 (tcp) failed: Address already in use

Причина, по которой я указал тот же исходный порт с -p, заключается в том, чтобы подтвердить, что исходный порт может быть совместно использован. Практически в этом нет необходимости; в реальной ситуации я бы вообще не беспокоился об исходном порте. Исходя из этого, действительно ли это правда, что исходный порт будет использоваться только один раз?

Question 2

Нет причин, по которым два процесса не могут использовать один и тот же исходный порт, если только они не оба подключаются к одной и той же цели (хосту, порту). На многих системах UNIX установите SO_REUSEPORT, чтобы разрешить процессам использовать один и тот же номер порта; на Windows установите SO_REUSEADDR. Например, с помощью socat:

процесс 1: socat stdio tcp:google.com:80,bind=:12345,reuseport
процесс 2: socat stdio tcp:bing.com:80,bind=:12345,reuseport

Эти два процесса могут работать одновременно и оба будут иметь исходный порт 12345 (как вы можете подтвердить с помощью netstat).

Однако обратите внимание, что вы почти наверняка столкнетесь с проблемами, если сокеты не будут корректно закрыты с обеих сторон, поскольку незакрытые TCP-сокеты войдут в состояние TIME_WAIT, что приведет к блокировке четверки (srcaddr, srcport, dstaddr, dstport) до истечения периода ожидания. Поэтому, когда вы используете один исходный порт для нескольких соединений, вы не сможете повторно подключиться к точно тому же серверу и порту, если предыдущее соединение полностью не завершено или период TIME_WAIT не истек.

Question 3

Любой порт всегда выделяется только одному процессу в любой момент времени. Этот процесс может установить любое количество соединений, с тем ограничением, что целевой IP-адрес или номер порта должны различаться между соединениями.

Например, TCP 10.0.0.10:49152 может подключиться только один раз к TCP 10.0.0.2:80, но в то же время может подключиться к TCP 10.0.0.3:80 или TCP 10.0.0.2:8080.

Question 4

Хотя сам протокол TCP позволяет произвольные комбинации локальных и удаленных портов и адресов, большинство реализаций Unix упрощают управление портами. Причина в том, что процесс настройки сокетов разделен на отдельные этапы.

Сначала вы устанавливаете локальный порт с помощью bind(). Этот шаг необходим при создании прослушивающего TCP-сокета (вы должны указать, на каком порту он слушает), он не обязателен перед установлением исходящего соединения с connect() (будет назначен произвольный локальный порт). Поскольку мы еще не знаем удаленный адрес или порт, невозможно сказать, уникален ли он. Так что просто проверяется, доступен ли запрашиваемый порт. Если у сокета установлен параметр SO_REUSEADDR, он игнорирует подключенные сокеты при проверке, используется ли локальный адрес, но все равно не получится, если на порту имеется прослушивающий сокет.
Затем для исходящего соединения вы вызываете connect(), указывая удаленный адрес. Вы можете вызвать connect() только один раз на сокете, и поскольку мы проверили локальный порт во время bind(), это никогда не приведет к дублированию локального/удаленного адреса/порта.
Для входящего соединения вы вызываете accept() на прослушивающем сокете. Снова, потому что мы проверяем, что локальный порт прослушивающего сокета не используется, когда мы его связываем, не может быть дублирующей комбинации.

Отсрочка проверок портов до получения удаленной информации усложнила бы обработку ошибок. Текущий дизайн просто проверяет на дублирование в одном месте: bind().

Question 5

После некоторых исследований я обнаружил, что совместное использование исходного порта разрешено только для нескольких исходящих соединений из одного и того же процесса. Операционной системе нужно знать, какому процессу перенаправить поток соединения.

Я собираюсь выбрать этот ответ через два дня согласно политике сайта.

Question 6

Я собираюсь высказать мнение с другой точки зрения: истощение исходных портов, когда у вас высокая скорость соединений/разъединений из-за TIME_WAIT.

Первое примечание: TIME_WAIT не зависит от tcp_fin_timeout. Вместо этого, он жестко закодирован на 60 секунд. tcp_fin_timeout относится к другой стороне.

Например, если у вас есть веб-сервер, который обрабатывает 1000 запросов в секунду, и ваш веб-сервер имеет несчастную, но часто используемую модель «начать код в рабочем процессе/выполнить действия/завершить» (как PHP FPM), каждый запрос будет открывать и закрывать соединение с базой данных. Это приводит к 60000 портам к базе данных в состоянии TIME_WAIT, в соответствии с жестко закодированным временем 60 секунд. Это слишком много, и вы получаете сообщение ‘не удается назначить запрашиваемый адрес’.

Все эти разговоры о SO_REUSEPORT бессмысленны, потому что у вас нет контроля над этим в соединителе mysql. Более того, если у вас есть другие процессы, работающие под другим UID, вы не можете делиться.

Драйвер PHP MySQL не поддерживает выбор исходного адреса, как это делает curl.

Таким образом, решением будет добавление большего количества IP-адресов на машину и использование haproxy, например, для ротации исходного адреса:

# Способ избежать проблемы TIME_WAIT (исчерпание портов на нашем исходном
# адресе), ротируя по нашим IP
frontend mysqlfront
  mode tcp
  bind 127.0.0.1:3306
  default_backend mysqlback

# Способ избежать проблемы TIME_WAIT (исчерпание портов на нашем исходном
# адресе), ротируя по нашим IP
backend mysqlback
  mode tcp
  balance leastconn
  server mysql_s1 server.com:3306 source 172.31.7.124
  server mysql_s2 server.com:3306 source 172.31.12.99

Совместное использование исходного порта TCP

Вопрос или проблема

Ответ или решение

Понимание совместного использования портов источника TCP

Основы идентификации TCP-соединений

Поведение систем при создании соединений

Опции для совместного использования портов

Влияние состояния TIME_WAIT

Практическое применение и возможные решения