Как мне найти общее количество TCP-соединений для данного порта и периода времени по IP?

Question 1

В системе Linux существует множество методов для отображения текущих TCP-соединений для заданного порта по соединяющему IP, но: как я могу посчитать общее количество соединений на порт по исходному IP за период времени?

Question 2

Включите iptables и установите его на LOG для входящих соединений. Пример правила:

 -A INPUT --state NEW -p tcp --dport 4711 -j LOG

(где 4711 — это порт, который вы хотите отслеживать).

Затем пропустите полученный лог через любой скрипт, который вам по душе, чтобы сделать сводку.

Question 3

Вы можете использовать tcpdump для логирования всех SYN (без ACK) пакетов:

tcpdump "dst port 4711 and tcp[tcpflags] & (tcp-syn|tcp-ack) == tcp-syn"

или логировать все SYN+ACK пакеты (установленные соединения):

tcpdump "src port 4711 and tcp[tcpflags] & (tcp-syn|tcp-ack) == (tcp-syn|tcp-ack)"

А затем соедините это с wc -l для подсчета всех строк

Вам также потребуется способ измерения фиксированных периодов времени (вы можете использовать cron для отправки SIGINT через регулярные интервалы времени, tcpdump будет считать байты и пакеты, но только логирует время)

Обновление: не обязательно говорить, взгляните на man-страницу tcpdump и рассмотрите использование таких опций, как: -i (слушать только один интерфейс), -p (отключить режим promiscuous; менее инвазивно) или некоторые опции вывода. Tcpdump требуется root-права, а вашему начальнику это может не понравиться, потому что это своего рода инструмент хакера. С другой стороны, вам не нужно трогать ничего в вашей системе, чтобы запустить его (в отличие от решения с iptables LOG)

Пожалуйста, обратите внимание на небольшую разницу src/dst в фильтре. Если вы ловите SYN+ACK пакеты и хотите подсчитать соединения к серверу на порту 4711, вам нужен src. Если вы ловите SYN+!ACK пакеты для того же результата, вам нужен dst. Если вы считаете соединения на самом сервере, всегда нужно использовать обратное.

Question 4

Решение SystemTap

Скрипт, вдохновленный примером tcp_connections.stp:

#!/usr/bin/env stap
# Чтобы мониторить другой TCP порт, выполните:
#     stap -G port=80 tcp_connections.stp
# или
#     ./tcp_connections.stp -G port=80
global port = 22
global connections

function report() {
  foreach (addr in connections) {
    printf("%s: %d\n", addr, @count(connections[addr]))
  }
}

probe end {
  printf("\n=== Сводка ===\n")
  report()
}

probe kernel.function("tcp_accept").return?,
      kernel.function("inet_csk_accept").return? {
  sock = $return
  if (sock != 0) {
    local_port = inet_get_local_port(sock)
    if (local_port == port) {
      remote_addr = inet_get_ip_source(sock)
      connections[remote_addr] <<< 1
      printf("%s Новое соединение от %s\n", ctime(gettimeofday_s()), remote_addr)
    }
  }
}

Вывод:

[root@bubu ~]# ./tcp_connections.stp -G port=80
Пн Мар 17 04:13:03 2014 Новое соединение от 192.168.122.1
Пн Мар 17 04:13:04 2014 Новое соединение от 192.168.122.1
Пн Мар 17 04:13:08 2014 Новое соединение от 192.168.122.4
^C
=== Сводка ===
192.168.122.1: 2
192.168.122.4: 1

Решение strace

Либо запустить программу под strace:

strace -r -f -e trace=accept -o /tmp/strace ${PROGRAM} ${ARGS}

или отслеживать уже выполняющуюся программу:

strace -r -f -e trace=accept -o /tmp/strace -p ${PID_OF_PROGRAM}

-r выведет относительную метку времени при входе в каждый системный вызов, если это потребуется позже для дополнительного анализа производительности. -f будет отслеживать дочерние процессы и может не потребоваться.

Вывод выглядит примерно так:

999        0.000000 accept(3, {sa_family=AF_INET, sin_port=htons(34702), sin_addr=inet_addr("192.168.122.4")}, [16]) = 5
999        0.008079 --- SIGCHLD (Дочерний процесс завершен) @ 0 (0) ---
999        1.029846 accept(3, {sa_family=AF_INET, sin_port=htons(34703), sin_addr=inet_addr("192.168.122.4")}, [16]) = 5
999        0.008276 --- SIGCHLD (Дочерний процесс завершен) @ 0 (0) ---
999        3.580122 accept(3, {sa_family=AF_INET, sin_port=htons(50114), sin_addr=inet_addr("192.168.122.1")}, [16]) = 5

и может быть отсортирован с помощью:

# gawk 'match($0, /^([0-9]+)[[:space:]]+([0-9.]+)[[:space:]]+accept\(.*htons\(([^)]+)\),.*inet_addr\("([^"]+)"\).*[[:space:]]+=[[:space:]]+([1-9][0-9]*)/, m) {connections[m[4]]++} END {for (addr in connections) printf("%s: %d\n", addr, connections[addr]); }' /tmp/strace
192.168.122.4: 3
192.168.122.1: 2

Краткое объяснение однострочника AKW: m[1] — это PID, m[2] — временная метка, m[3] — удаленный порт, а m[4] — удаленный адрес.

Преимущество этого решения заключается в том, что root-права не требуются, если сервер работает под той же учетной записью пользователя. Недостаток заключается в том, что все соединения подсчитываются без фильтрации, поэтому это не сработает, если приложение слушает на нескольких портах.

Question 5

Ваша система не будет запоминать количество предыдущих соединений, если вы специально не предусмотрите это, поэтому не ожидайте найти такие счетчики, как у вас для общего трафика через интерфейс, если вы не настроите что-то для подсчета.

Кроме того, в общем смысле, вы не можете осуществлять подсчет надежно по запросам, как предложил Яцек Лакомиец, так как некоторые соединения могут начаться и закончиться быстрее, чем период вашего запроса. Такой подход может быть приемлемым для некоторых ситуаций, в которых вы уверены, что время, в течение которого устанавливаются соединения, достаточно долгое, но я не могу придумать хороших причин предпочесть его.

Как предложили Дженни Д. и Даниэль Альдер, ваши варианты для подсчета соединений в процессе их возникновения — это в основном счетчики на основе брандмауэра и счетчики на основе захвата пакетов. Оба метода обычно работают хорошо, хотя если ваш процессор ограничен в ресурсах, вы можете не посчитать некоторые соединения, если используете метод на основе пакетов. Также это может потребовать больше системных ресурсов для подсчета. С другой стороны, подходы на основе захвата пакетов могут быть проще и безопаснее для настройки в случае внеплановых расследований.

Существует другой общий класс решения, который называется netflow. Его сложнее настроить, но если это сделано правильно, он особенно эффективен, и если вы занимаетесь крупномасштабным или постоянным мониторингом, я бы смотрел в эту сторону. Собирать сырые данные можно в вашем брандмауэре (например, с помощью fprobe-ulo) или с использованием libpcap, который медленнее (например, fprobeg). Система захвата отправляет данные о потоках через сеть на коллектор (например, nfdump), а затем у вас появляются различные инструменты для анализа этих данных (например, nfsen).

Некоторые маршрутизаторы (особенно оборудование от Cisco) поддерживают захват netflow, и его также можно настроить на других маршрутизаторах с помощью сторонней прошивки. Конечно, вы можете запустить его на вашей системе Linux. При желании многие точки сбора могут пересылать свои данные потока единому коллектору. Вы можете найти бесплатные программные опции, например, на http://www.networkuptime.com/tools/netflow/, а также существует множество коммерческих предложений.

Netflow предназначен для использования в промышленных масштабах, но я нашел его очень удобным для сбора данных об использовании моей домашней сети в коммунальной квартире, чтобы я мог определить, кто или что является причиной, когда использование трафика выше ожидаемого.

Будьте осторожны, когда вы изменяете правила брандмауэра на удаленном сервере, и, вообще говоря, я бы рекомендовал найти хороший интерфейс для настройки вашего брандмауэра, вместо того чтобы использовать команды iptables напрямую. (Мне нравится ferm, но есть много хороших опций).

Еще одно, о чем стоит подумать, – иногда вы не хотите делать это на сетевом уровне вообще. Иногда уместно мониторить системные вызовы процесса-демона с помощью strace или аналогичного инструмента. Это весьма ресурсоемко, и будьте осторожны, чтобы не замедлить процесс демона, но в некоторых обстоятельствах это может быть уместно, в зависимости от того, какую информацию вам также необходимо собрать или, возможно, если вам необходимо изолировать один форкованный дочерний процесс демона.

Question 6

На данный момент наиболее работавшее для меня решение было просто считывать содержимое /proc/net/ip_conntrack каждые 20 секунд, логируя это в файл с именем, содержащим соответствующую временную метку, и используя их в качестве входных данных для любых фильтрующих скриптов или даже однострочников при необходимости. Чтобы сэкономить время, вы можете использовать мой скрипт. Я использую записи в crontab, чтобы убедиться, что скрипт запускается каждую минуту (он выполняется 60 секунд в текущей конфигурации, не стесняйтесь модифицировать его :-))

 cat conn_minute.sh
#!/bin/bash

function save_log {
LOG_DIR=/mnt/logs/ip_conntrack/`date +%Y%m%d`
TEMP_FILE=$LOG_DIR/`date +%Y%m%d_%H%M%S`.gz
LOG_FILE=$LOG_DIR/`date +%Y%m%d_%H`.tar
if [ ! -d $LOG_DIR ]
then
    mkdir $LOG_DIR
fi
gzip -c /proc/net/ip_conntrack > $TEMP_FILE
if [ -f $LOG_FILE ]; then
    tar -rf $LOG_FILE $TEMP_FILE 2> /dev/null
else
    tar -cf $LOG_FILE $TEMP_FILE 2> /dev/null
fi
rm $TEMP_FILE
}
function log_minute {
i=1;
LOOP_COUNTER=3
LOOP_TIME=20
while [ $i -le $LOOP_COUNTER ]; do
    save_log
    i=$[i+1]
    sleep $LOOP_TIME
done
}

log_minute

Вы можете настроить, как часто вы хотели бы выкладывать содержимое ip_conntrack, изменяя LOOP_COUNTER и LOOP_TIME соответствующим образом. Чтобы получать это каждые 5 секунд, это будет: LOOP_COUNTER=12, LOOP_TIME=5.

После этого вы можете использовать zcat для того, чтобы выводить файлы, которые вас интересуют, и использовать grep для фильтрации исходных IP/портов, которые вас интересуют (или просто использовать zgrep). grep -c подсчитает, что угодно, за чем вы охотитесь. Вы также можете использовать grep src=1.2.3.4 | grep dport=63793 | sort | uniq | wc -l.

Question 7

Записывайте лог самостоятельно:

$> nohup netstat -c | grep -E "xxx|xxxx" >> netstat_log 2>&1 &

nohub перетаскивает этот процесс в фоновый режим, чтобы он пережил ваш выход

netstat -c заставит netstat выводить выбранную информацию каждую секунду, непрерывно, навсегда

grep -E “xxx|xxxx” перехватит ваш желаемый контент, например, порт и

>> netstat_log … запишет это в “./netstat_log” (используйте ваш желаемый файл журнала здесь)

Переадресация вывода в | wc -l будет считать (wc) строки (-l) этого.

Question 8

Я думаю, что ответ Дженни Д. хороший, только он создает лог, который вы затем должны разобрать для даты и посчитать количество строк. Это может быть утомительным и долгим. Это также использует много места на диске.

Следующее правило (Дженни без -j):

-A INPUT --state NEW -p tcp --dport 4711

работает так же без логирования, но включает счетчик. Затем вы можете прочитать этот счетчик, чтобы получить необходимую информацию. Вы можете прочитать счетчик и сбросить его атомарным образом, предоставляя вам действительно точное количество за время. Тогда вы можете просто сохранить это количество.

Чтобы сделать проще чтение счетчика, вы, вероятно, захотите добавить правило в свою собственную цепочку. Таким образом, вы можете лучше контролировать позицию вашего правила.

-A counters --state NEW -p tcp --dport 4711

И в цепочке INPUT, вызовите цепочку counters:

-A INPUT -j counters

(Вы можете оптимизировать это, если у вас есть несколько счетчиков, и все они требуют состояния NEW, вас интересует только TCP, соединения должны быть на конкретном интерфейсе и т.д., добавив это в правило -A INPUT вместо каждого отдельного правила в цепочке counters.)

Вот команда, которую вам нужно запустить, чтобы получить и сбросить счетчик атомарно:

sudo iptables -nvx -L counters 1 -Z counters 1 | awk '{ print $1 }'

Если у вас есть несколько счетчиков, вы можете изменить две 1 для извлечения другого:

# извлеките счетчик 3
sudo iptables -nvx -L counters 3 -Z counters 3 | awk '{ print $1 }'

Опции -nvx важны:

-n предотвращает обратные DNS-запросы (что здесь было бы действительно бесполезно)
-v включает счетчики в вывод
-x выводит счетчик без округления до тысяч, миллионов, гигабайт…

Команда awk ... используется для извлечения самого первого слова, которое является вашим счетчиком.

Опция -Z очищает счетчик после вызова. Это означает, что он будет снова считать. Если, например, вы проверяете раз в час, вы получите количество всего, что ваше правило ловит за час. Вы можете последнюю команду iptables запускать через crontab или аналогичный планировщик (systemd предлагает таймерные единицы).

В случае, если у вас много счетчиков, вы можете заинтересоваться получением индекса каждого из них (или возможно вам нужны другие подцепочки…) и вы можете это сделать с помощью опции --line-numbers:

sudo iptables -nvx --line-numbers -L counters

(Здесь опции v и x не обязательны.)

Question 9

Взгляните на

. Они все немного устарели, но писать скрипты, чтобы делать работу, которую другие сделали лучше, скучно. Некоторые дают вам красивые графики, некоторые более специализированы для судебного анализа и привязки плохих парней, некоторые (iplog) являются просто очень простыми счетчиками, которые логируют в базы данных, некоторые имеют блестящие интерфейсы, которые можно показать вашему начальнику.

Также существует множество инструментов для реализации бесплатного стека, совместимого с netflow, на linux. И множество людей пытаются продать поддержку вокруг этого. (Я не буду рекомендовать коммерческий продукт…) То, чего вы просите, намного проще, чем то, на что способны некоторые из этих инструментов.

На мой взгляд (Free|Net|Open)BSD значительно опередили в этом анализе годы назад. Брандмауэр pFsense предоставит вам по крайней мере 7 опций из коробки.

Как мне найти общее количество TCP-соединений для данного порта и периода времени по IP?

Вопрос или проблема

Решение SystemTap

Решение strace

Ответ или решение

1. Использование Iptables

Настройка логирования через Iptables

Преимущества и недостатки

2. Использование Tcpdump

Захват пакетов SYN

Подсчет с помощью wc -l

Преимущества и недостатки

3. SystemTap

4. NetFlow

Заключение