Каково интуитивное значение “веса листа” в xgboost?

Question 1

Я просмотрел презентацию Тянци Чена, но мне сложно понять детали, касающиеся весов листьев, и я был бы признателен, если бы кто-то помог прояснить это.

Чтобы выразить уравнения словами на слайде “Помещено в контекст: модель и параметры”, предсказанное значение/оценка (обозначаемая как yhat) равна сумме K деревьев модели, где каждое сопоставляет атрибуты с оценками. Пока все в порядке, думаю.

Затем на следующем слайде показан пример дерева решений, вычисляющего, насколько кому-то нравится компьютерная игра X. (Кстати, разве это не странный пример? Кому-то нравится компьютерная игра X на 2? Что это вообще значит? Почему бы не выбрать пример с более конкретным, осмысленным значением?)

Теперь, тут я начинаю теряться. Я могу составить макетные данные для этого примера, предполагая, что модель идеальна, так что веса (w1, w2, w3) равны истинному значению. Но даже это представляется странным: в чем разница между предсказанным значением/оценкой и весами?

       x_i: "атрибуты"          y_i, истинная оценка (не yhat_i, который является предсказанной оценкой)
                |                                 |
|¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯|¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯¯|
| Возраст <15 (x_0) | мужской пол (x_1) | На сколько нравится компьютерная игра X  |
| 1             | 1             | 2                                  | (Мальчик)
| 1             | 0             | 0.1                                | (Девочка)
| 0             | 1             | -1                                 | (Пожилой мужчина)
| 0             | 0             | -1                                 | (Пожилая женщина)
| 0             | 0             | -1                                 | (Молодая женщина, старше 15 лет)

Мой вопрос: Может кто-нибудь поделиться, какой будет ФАКТИЧЕСКАЯ функция f? Я предполагаю, что это вектор/матрица, но каковы истинные числа? Затем мой дополнительный вопрос: как бы вы рассчитали f для этого примера? Я чувствую, что это очень просто, но не могу найти ответ. Если кто-то смог бы подробно разъяснить это, это было бы огромной помощью. Спасибо!

Question 2

Я бы прочитал статью (особенно раздел 2.2) для более краткого изложения и формального определения терминов.

Вам нужно определить функцию потерь $\mathcal{L}$ для вашей задачи. Тогда $g_i$ и $h_i$ являются первой и второй производными от $\mathcal{L}$ соответственно. Оптимальные веса тогда (уравнение (5) или слайд 27).
$$
w_j^* = -\dfrac{\sum_{i \in I_j}g_i}{\sum_{i \in I_j}h_i + \lambda}
$$
где $\lambda$ — это параметр регуляризации.

Таким образом, эти веса дают минимум (второго порядка приближения) $\mathcal{L}$.

Редактировать:

Поскольку веса даны в примере, основная работа уже выполнена (см. Рисунок 1 в статье). Следуя определениям, $f =w_{q(x)}$ и $q(x)$ сопоставляет экземпляр с листовым узлом. Собрав это вместе, получаем:
$$
f = \begin{cases}
2 & \mbox{возраст} < 15 \mbox{ и } \mbox{мужской пол} \\
0.1 & \mbox{возраст} < 15 \mbox{ и } \mbox{не мужской пол} \\
-1 & \mbox{возраст} \geq 15
\end{cases}
$$

Question 3

Не знаю, решила ли вы проблему или нет… но я считаю, что это фактически “выход”, а именно $f_t(x_i)$. Вы можете это увидеть, проверив уравнение (4) в их статье.

https://stats.stackexchange.com/questions/509970/are-leaf-weights-in-xgboost-equivalent-to-output-values Эта ссылка говорит то же самое.

Каково интуитивное значение “веса листа” в xgboost?

Вопрос или проблема

Ответ или решение

Теория: Что такое "вес листа" в XGBoost?

Пример: Роль и расчет веса листа

Применение: Как использовать веса листьев на практике?