Сетевое взаимодействие Google Cloud: Низкая скорость входящего трафика на виртуальных машинах Google Cloud (GCE)

Вопрос или проблема

Привет!

Мы сталкиваемся с проблемой, когда скорость входящей сети составляет всего около одной десятой от исходящей скорости, и это происходит на всех типах виртуальных машин в Google Cloud Compute Engine.

Мы провели тесты iperf3 с различными дистрибутивами Linux и межсетевыми экранами, и результаты одинаковы для всех. Ниже приведен результат теста производительности с использованием внешнего оптоволоконного соединения 500 Мбит/с в той же зоне GCE, где работают виртуальные машины:

Изменение количества vCPU, типа интерфейса или уровня сети (стандартный или премиум) не влияет. Настройки MTU также не влияют.

Мы столкнулись с неизвестным/скрытым ограничением, которое тормозит входящий трафик?

Любая информация о том, где может находиться узкое место и как устранить сетевые проблемы в Google Cloud, приветствуется!


Конфигурация теста:
  • Тип машины: e2-highcpu-4
  • Уровень сети: премиум
  • Тип интерфейса: gVNIC
Результаты теста:

# Входящий (внешний -> GCE)

[ ID] Интервал Передача Скорость Пакеты Cwnd
[ 5] 0.00-1.00 сек 8.50 MBytes 8697 KBytes/sec 23 42.0 KBytes
[ 5] 1.00-2.00 сек 5.25 MBytes 5367 KBytes/sec 16 49.2 KBytes
[ 5] 2.00-3.00 сек 5.62 MBytes 5768 KBytes/sec 17 28.8 KBytes
[ 5] 3.00-4.00 сек 4.50 MBytes 4612 KBytes/sec 13 45.6 KBytes
[ 5] 4.00-5.00 сек 7.50 MBytes 7673 KBytes/sec 9 66.0 KBytes
[ 5] 5.00-6.00 сек 7.50 MBytes 7655 KBytes/sec 5 92.3 KBytes
[ 5] 6.00-7.00 сек 5.38 MBytes 5522 KBytes/sec 22 22.8 KBytes
[ 5] 7.00-8.00 сек 3.50 MBytes 3584 KBytes/sec 18 33.6 KBytes
[ 5] 8.00-9.00 сек 6.38 MBytes 6528 KBytes/sec 6 39.6 KBytes
[ 5] 9.00-10.00 сек 5.75 MBytes 5887 KBytes/sec 9 54.0 KBytes
- - - - - - - - - - - - - - - - - - - - - - - - - -
[ ID] Интервал Передача Скорость Пакеты
[ 5] 0.00-10.00 сек 59.9 MBytes 6130 KBytes/sec 138 отправитель
[ 5] 0.00-10.04 сек 59.6 MBytes 6077 KBytes/sec получатель

# Исходящий (GCE -> внешний)

[ ID] Интервал Передача Скорость
[ 5] 0.00-1.00 сек 55.2 MBytes 56518 KBytes/sec
[ 5] 1.00-2.00 сек 55.2 MBytes 56575 KBytes/sec
[ 5] 2.00-3.00 сек 55.5 MBytes 56889 KBytes/sec
[ 5] 3.00-4.00 сек 55.1 MBytes 56412 KBytes/sec
[ 5] 4.00-5.00 сек 55.6 MBytes 56876 KBytes/sec
[ 5] 5.00-6.00 сек 55.6 MBytes 57067 KBytes/sec
[ 5] 6.00-7.00 сек 55.6 MBytes 56969 KBytes/sec
[ 5] 7.00-8.00 сек 55.4 MBytes 56673 KBytes/sec
[ 5] 8.00-9.00 сек 55.5 MBytes 56856 KBytes/sec
[ 5] 9.00-10.00 сек 55.5 MBytes 56811 KBytes/sec
- - - - - - - - - - - - - - - - - - - - - - - - - -
[ ID] Интервал Передача Скорость Пакеты
[ 5] 0.00-10.04 сек 558 MBytes 56886 KBytes/sec 596 отправитель
[ 5] 0.00-10.00 сек 554 MBytes 56765 KBytes/sec получатель

 

 

 

Ответ или решение

Теория

Google Cloud Platform (GCP) известен своей масштабируемостью и надёжностью, но, как и в любом другом облачном сервисе, могут возникать определённые трудности с производительностью сети. В вашем случае проблема заключается в заметно меньшей входящей скорости сети (иногда до одной десятой от исходящей) для виртуальных машин (VM) в Google Cloud Compute Engine (GCE). Это может быть вызвано различными факторами, включая настройки сети, параметры виртуальных машин и более сложные системные ограничения, такие как квоты или ограничения по трафику.

В вашем описании видно, что вы протестировали различные конфигурации, такие как количество виртуальных ЦПУ и типы интерфейсов, но не увидели изменений. Кроме того, параметры MTU также не оказали влияния на производительность. Скорее всего, вы столкнулись с какой-то особенностью или ограничениями, которые не так очевидны при стандартной эксплуатации.

Пример

Для дальнейшего анализа давайте разберём ваши тесты:

  • Входящий трафик (external -> GCE): Скорость варьируется и значительно ниже ожидаемой. Средняя скорость составляет около 6130 KBytes/sec.

  • Исходящий трафик (GCE -> external): Значительно выше, порядка 56886 KBytes/sec.

Несмотря на то, что были использованы различные типы в конфигурациях (например, gVNIC, премиум слой сети), результаты остаются низкими.

Применение

Чтобы улучшить ситуацию, предлагаю следующие шаги для детального анализа проблемы и, возможно, её решения:

  1. Анализ квот и ограничений: Проверьте, не стоит ли квота на трафик для вашего проекта в Google Cloud. Квоты могут ограничивать пропускную способность, несмотря на изменения в конфигурациях виртуальных машин. Это может быть либо проблема общесистемного лимита, либо конкретные ограничения вашего плана.

  2. Проверка конфигураций сети:

    • Убедитесь, что все правила брандмауэра на уровне проекта и сети корректно настроены. Неправильные правила могут блокировать или ограничивать входящий трафик.
    • Перепроверьте настройки маршрутизации на предмет потенциальных узких мест или неправильно настроенных маршрутов.
  3. Диагностика аппаратных ограничений:

    • Использованные вами типы машин (например, e2-highcpu-4) могут иметь внутренние ограничения на скорость обработки сетевого трафика. Рассмотрите возможность использования других типов машин с большими вычислительными мощностями.
  4. Тестирование на другие зоны/регионы:

    • Чтобы выявить системную или региональную проблему, попробуйте запустить тесты в других зонах или регионах GCP. Это позволит устранить возможные проблемы у конкретного дата-центра.
  5. Анализ интерфейсов: Даже если смена типа интерфейса не дала результатов, попробуйте повторно протестировать классические и альтернативные интерфейсы (например, gVNIC и стандартные) в сочетании с изменением конструкций VM.

  6. Мониторинг и логирование:

    • Подключите дополнительные инструменты мониторинга и логирования от Google (например, Stackdriver), чтобы получить подробные отчёты о поведении сети. Это поможет выявить точные моменты, где возникают задержки.
  7. Обращение к поддержке: Если все вышеописанные шаги не привели к улучшениям, имеет смысл обратиться в техподдержку Google. Предоставив им все собранные вами данные тестов и мониторинга, вы получите более детализированную консультацию.

В завершение, устранение проблем с сетью в облачной инфраструктуре часто требует системного подхода и вовлечения специалистов как со стороны клиента, так и со стороны провайдера услуг. Следует тщательно проверять и тестировать все возможные причины: начиная от конфигураций сети до внутренних ограничений платформы.

Оцените материал
Добавить комментарий

Капча загружается...