Как работают лимиты памяти в Kubernetes с cgroup v2 memory.high?

Question

Я пытаюсь понять, как работают запросы и лимиты памяти с cgroup v2. В манифесте Kubernetes мы можем настроить запросы памяти и лимит памяти. Эти значения затем используются для настройки интерфейса cgroup:

memory.min устанавливается в запрос памяти
memory.max устанавливается в лимит памяти
memory.high устанавливается в лимит памяти * 0.8, если запрос памяти не равен лимиту, в противном случае memory.high остается не установленным
memory.low всегда не установлен

memory.max довольно самоочевидно: Когда процесс в cgroup пытается выделить страницу, и это приведет к превышению использования памяти над memory.max, а вернуть недостаточно страниц из cgroup, чтобы удовлетворить запрос в пределах memory.max, то вызывается OOM-убийца, чтобы завершить процесс внутри cgroup. memory.high понять сложнее: Документация ядра говорит, что cgroup находится под «высоким давлением на возврат», когда достигается высокий уровень, но что это конкретно означает?

Далее говорится:

Когда это происходит, оно ограничивает выделения, принуждая их к прямому возврату, чтобы избавиться от избыточности, но никогда не вызывает OOM-убийцу.

Правильно ли я предполагаю, что это означает, что когда cgroup пытается выделить страницу за пределами высокого уровня memory.high, она будет синхронно обращаться к lruvecs и пытаться вернуть как можно больше страниц из конца списков, пока не окажется ниже высокого уровня? Или «давление на возврат» — это что-то, что происходит асинхронно (через kswapd)?

Вопрос 2: В чем вообще смысл использования memory.high в Kubernetes? Насколько мне известно, узлы Kubernetes обычно работают без разделяемого пространства. Единственные страницы, которые можно вернуть, — это анонимные страницы (если достаточно доступно свопа) и кэш страниц. Поскольку свопа нет, остается только кэш страниц. Дело в том, что кэш страниц также будет возвращаться при достижении memory.max, прежде чем инициировать OOM-убийцу как последнее средство, если ничего нельзя вернуть. Таким образом, memory.high по сути бесполезен:

Пока используется кэш страниц, его всегда можно вернуть, и memory.max тоже это сделает. С memory.high мы просто ограничиваем приложение раньше, чем это нужно. Можно было бы установить memory.max ниже изначально.
Если значительный кэш страниц не используется (что, вероятно, является случаем для большинства приложений, работающих на Kubernetes сегодня), то ничего нельзя вернуть, следовательно, нет ограничения (нет выгрузки неиспользуемой анонимной памяти, нет угрожающих сигналов в информации о давлении, которые могли бы нас предостеречь), и мы столкнемся с memory.max, не заметив. Использование memory.high не имеет эффекта.

Как работают лимиты памяти в Kubernetes с cgroup v2 memory.high?

Вопрос или проблема

Ответ или решение

Работа с memory.high

Как работает "высокая" нагрузка на рефайл

Зачем использовать memory.high в Kubernetes?