Что вызывает операции с памятью ядра в статистике perf для процесса только в пользовательском пространстве?

Question 1

Я запускаю простую программу, в которой:

Поток, закрепленный за ЦП 1, выполняет случайные чтения из предварительно выделенной и инициализированной области памяти объемом 2 ГБ, при этом никаких системных вызовов не производится в цикле доступа к памяти.
Perf выполняется в своем отдельном процессе, измеряя mem_inst_retired.all_loads:k,mem_inst_retired.all_stores:k -I 200 -p <pid>

Вот минимальный тестовый код:

void access_memory(char *memory) {
    // Закрепление потока за ЦП 1
    cpu_set_t cpuset;
    CPU_ZERO(&cpuset);
    CPU_SET(1, &cpuset);
    pthread_setaffinity_np(pthread_self(), sizeof(cpu_set_t), &cpuset);

    std::mt19937 gen(std::random_device{}());
    std::uniform_int_distribution<size_t> dist(0, 2GB - 500);
    char buffer[500];

    while (!should_stop) {
        size_t offset = dist(gen);
        memcpy(buffer, memory + offset, 500);
        buffer[0]++; 
    }
}

Вопросы:

Почему происходят операции с памятью ядра, когда процесс только выполняет чтения памяти из пользовательского пространства? Хотя это может быть наблюдательным эффектом, могут ли прерывания, сгенерированные PMU (Устройством мониторинга производительности) для выборки, вызывать выполнение операций с памятью ядром, которые приписываются процессу доступа? Я пролистал SDM, но не нашел хорошего ответа.
Как perf приписывает операции в режиме ядра конкретному процессу? В случае системных вызовов ясно, что ядро работает “от имени” процесса, но как насчет задач ядра, таких как планирование, компактация памяти или балансировка нагрузки, которые могут повлиять на процесс? Где он проводит грань?

Я замечаю, что изменение интервала выборки с 200 мс до 5 с изменяет количество измеренных операций ядра с ~10^5 до ~10^7 операций на интервал.

Вот простой код, который выполняет доступы и измеряет активность загрузки/записи:
https://gist.github.com/VinayBanakar/8cd04c5fa03a6895292498d3e3687aac

Question 2

Обработчики прерываний и исключений не переключаются контекстом с current задачи (пока/если планировщик не решит, что они это делают), поэтому аппаратные счётчики производительности остаются запрограммированными (в вашем случае для подсчета инструкций записи ядра) во время выполнения обработчиков прерываний, вызванных таймерами и внешним оборудованием.

Страницы ошибок – это распространённый тип исключений, который вызывает выполнение кода ядра. Например, обнуление новых страниц стека, BSS или кучи (mmap(MAP_ANONYMOUS)), когда вы впервые их записываете. (Если первый доступ – это чтение, то оно будет копировать по ссылке на запись на системную общую страницу нулей.) Итак, у вас, вероятно, есть несколько страниц ошибок, которые предполагают хранение целой страницы нулей ядром, когда вы используете новое пространство стека, но в остальном ваши разбросанные чтения должны просто приводить к записям в структуры данных таблицы страниц, и накладным расходам на учёт ядра и вызовам функций.

Или если вы выполняете инициализацию до того, как perf подключается, тогда, вероятно, вы не будете измерять ни одной страницы ошибок.

Подсистема perf в Linux виртуализирует PMU (когда не в режиме полной системы) так же, как она виртуализирует другой контекст процесса, сохраняя/восстанавливая при переключении контекста. Переменная current, относящаяся к ядру, указывает на задачу, которая в данный момент выполняется на этом ядре.

perf stat генерирует минимальное количество прерываний, так как счетчики могут быть запрограммированы с таким высоким лимитом, насколько они поддерживают, поэтому события переполнения происходят очень редко. В отличие от perf record, где вы хотите достаточно частые прерывания для сбора значимой статистики.

Что вызывает операции с памятью ядра в статистике perf для процесса только в пользовательском пространстве?

Вопрос или проблема

Ответ или решение

Причины операций с памятью ядра в perf stats для процессов только в пользовательском пространстве

Введение

Описание проблемы

Причины операций с памятью ядра

Добавленные детали о `perf`

Заключение

Что вызывает операции с памятью ядра в статистике perf для процесса только в пользовательском пространстве?

Вопрос или проблема

Ответ или решение

Причины операций с памятью ядра в perf stats для процессов только в пользовательском пространстве

Введение

Описание проблемы

Причины операций с памятью ядра

Добавленные детали о perf

Заключение

Добавленные детали о `perf`