Оценка качества и точности рекомендаций

Question 1

Я разрабатываю систему рекомендаций, которая должна предоставить моим клиентам информацию о действиях, которые они должны предпринять, чтобы достичь определенных целей.
Основные механизмы этого процесса физические – как действия, так и результаты могут быть измерены физически.

Мой текущий алгоритм основан на предсказательной модели, которая может предсказать ожидаемый результат для данного действия.
Этот результат может быть оценен, и таким образом оценка* многих исходов может привести к нахождению лучшего действия – действия, которое будет рекомендовано.

*оценка основана на расстоянии между исходами и целями.

Эффективность моей предсказательной модели хороша (низкий MAE). Оценка ее производительности основана на предсказании уже предпринятого (исторического) действия и сравнении его предсказания с фактическими (историческими) исходами.

Проблема возникает, когда я пытаюсь оценить качество рекомендаций, поскольку многие рекомендации представляют собой действия, которые не были предприняты, и у меня мало способов оценить их качество.

Я пытался использовать фактические исходы в качестве “целей” для своей системы рекомендаций и сравнивать рекомендованное действие с фактически предпринятым действием.
Я не уверен, что это правильный путь, и любые советы были бы весьма полезны.

Question 2

Разобраться в причинно-следственных связях в этом типе рекомендательной системы сложно, но вполне осуществимо.

Учитывая, что у вас есть хорошая экспериментальная методология, и ваши оценочные данные генерируются на числах, не использованных для обучения (среди прочих соображений), кажется, что у вас есть лучшая оценка, которую вы можете получить (или вы находитесь в близости к этому) с использованием прошлых данных.

Следующий шаг будет состоять в создании нового эксперимента, в котором вы (в идеале) случайным образом предоставляете рекомендации одной группе и не предоставляете их другой группе, которые иначе идентичны. Затем вы измеряете результаты для обеих групп и статистически сравниваете их, чтобы определить наличие эффекта и его размер.

Предложить это исследование – ваш следующий шаг, если вы находитесь в организации, или провести его, если у вас есть возможность сделать это самостоятельно.

Question 3

Общий подход к этому – обучение с подкреплением. Он решает проблему оценки неиспользованных действий, выбирая их стохастически, причем степень исследования может быть параметром.

Другой общий подход – разработать хорошую модель окружения. Затем результаты на неиспользованных действиях могут быть оценены с помощью моделирования.

Оценка качества и точности рекомендаций

Вопрос или проблема

Ответ или решение

Оценка качества и точности рекомендаций в системах рекомендаций

Проблема в оценке качества рекомендаций

Эффективные методы оценки качества рекомендаций

Внедрение результатов анализа

Заключение