Вопрос или проблема
Я разрабатываю систему рекомендаций, в которой есть несколько категорий. Я хотел бы узнать, насколько популярен продукт в каждой категории. Для этого я рассматриваю вероятность как один из факторов. Например, у меня есть 3 категории ($C1$,$C2$,$C3$), так что я рассчитываю:
(Количество раз, когда конкретный товар в C1 был куплен)/(общее количество товаров, купленных из C1)
Это дает мне вероятность каждого товара в пределах категории. Кроме того, я также пытаюсь учесть:
(Общее количество раз, когда товар был куплен/общее количество раз, когда он был просмотрен)
Тем не менее, я не понимаю, как использовать соотношение покупок/просмотров с вероятностью. Кроме того, какие другие факторы я могу учесть?
Вам нужно встать на место бизнесменов и регулярно общаться с людьми из этого отдела, пытаясь понять, каковы потребности бизнеса. В электронной коммерции ваша вторая метрика — это Коэффициент конверсии и он определяется как:
CR = Заказы/Просмотры*
Обратите внимание, что существует две вариации Просмотры. Одна из Страницы списка продуктов (PLP), которая в основном известна как Впечатление, или та, которая происходит из Страницы деталей продукта (PDP), на которую пользователь фактически попадает. Последняя более распространена в расчете CR.
Первый показатель, то есть популярность, который мне как-то понравился, можно использовать. Только будьте осторожны, он будет зависеть от количества доступных товаров в этой категории.
В общем, я считаю полезным думать о крайних случаях, когда вы разрабатываете новые меры, и смотреть, является ли результат желаемым. Что я имею в виду под крайними случаями, давайте возьмем ваш балл популярности, по вашему определению, например. Представьте следующие два сценария:
- популярность товара 1 = 1/2 (очень ограниченное количество товаров в этой категории, где находится товар 1)
- популярность товара 2 = 1000/2000 (большое количество товаров в этой категории, где находится товар 2)
То, что вы здесь видите, выглядит вполне нормально с точки зрения математики по исходному определению. Однако с точки зрения рекомендаций/бизнеса это означает, что у вас похожие оценки двух товаров из двух разных категорий. Здесь бизнес может вмешаться и сказать, что у нас гораздо больше ассортимента в категории, где находится товар 2, и часто товары в этой категории находятся на складе или имеют более быструю доставку и т. д., тогда мы предпочли бы, чтобы наши товары оттуда рекомендовали в первую очередь. В этот момент вы понимаете, что, хотя результаты кажутся разумными, по крайней мере, согласно определению популярности, они не учитывают определенные аспекты.
Другие идеи: Я заметил, что вы склоняетесь к использованию нескольких оценок. Это отличная идея. Наличие нескольких факторов может учесть эти нюансы и одновременно удовлетворить несколько бизнес-потребностей. Например, наличие как CR, так и популярности. Или можно подумать о вклад каждого товара в прибыль для бизнеса и учесть это. Представьте, у вас есть система, которая дает равные шансы рекомендовать iPhone или беспроводную мышь, однако iPhone приносит гораздо больше прибыли бизнесу, тогда вам может понадобиться учесть этот фактор тоже. Вы также можете обратить внимание на Впечатление, о котором я упоминал, если оно доступно из вашего отслеживания. Рейтинг товара рейтинги, доставка, Добавить в корзину, Список желаемого или Время, проведенное над товаром — это другие вещи, над которыми стоит подумать. Проверьте этот пост, чтобы получить другие идеи о том, как примерно все это делается на Amazon. Надеюсь, это поможет.
Ответ или решение
Создание функции для определения популярности продукции в рамках рекомендательной системы требует комплексного подхода и вдумчивого анализа различных факторов, влияющих на восприятие и поведение пользователей. Представленный вами подход к вычислению популярности на основе вероятности — это хорошая основа, но его можно расширить и углубить для достижения более точных и подходящих рекомендаций.
Определение метрик популярности продукции
-
Вероятность покупки:
Как вы уже отметили, вы можете использовать следующую формулу для расчета вероятности покупки конкретного товара в категории:[
P_{\text{purchase}} = \frac{\text{Количество покупок товара в } C_i}{\text{Общее количество покупок в } C_i}
]Это даст общее представление о том, насколько данный товар популярен относительно других товаров в своей категории.
-
Коэффициент конверсии (CR):
Конверсия — еще один важный показатель, который вы упомянули. Определяется он по формуле:[
CR = \frac{\text{Количество заказов}}{\text{Количество просмотров}}
]Важно различать просмотры, полученные с различных источников (например, страницы списка товаров и страницы деталей товаров), так как это может существенно повлиять на интерпретацию данных.
-
Коэффициент покупки/просмотра:
Вы также можете вычислить отношение количества покупок к количеству просмотров, что может добавить дополнительный слой понимания:[
P/V = \frac{\text{Общее количество покупок}}{\text{Общее количество просмотров}}
]Это дает представление о том, как часто товар покупается после просмотра.
Комбинация метрик
Важно не рассматривать эти метрики изолированно, а использовать их совместно для получения обширного представления о популярности. Вы можете создать комбинированный рейтинг популярности, который учитывает все вышеперечисленные факторы. Например:
[
\text{Рейтинг популярности} = w1 \cdot P{\text{purchase}} + w_2 \cdot CR + w_3 \cdot \left( \frac{P}{V} \right)
]
где (w_1), (w_2) и (w_3) — веса, отражающие относительную важность каждой метрики для бизнеса.
Подходящие факторы для анализа
-
Прибыльность:
Учитывайте вклад товара в общую прибыль. Например, дорогие товары могут иметь меньший объем продаж, но обеспечивать значительно больший доход. -
Рейтинг товаров:
Хорошие отзывы и высокие оценки могут значительно увеличить привлекательность товара, даже если объемы продаж не очень велики. -
Количество добавлений в корзину и список желаемого:
Эти показатели могут указывать на заинтересованность клиентов, даже если окончательные покупки не произошли. -
Время, проведенное на странице товара:
Это может свидетельствовать о реальном интересе к товару. -
Импульсные покупки:
Анализируйте товары, которые часто покупаются вместе — это может помочь в формировании рекомендаций.
Резюме
Создание функции для определения популярности требует анализа множества факторов, и оптимальным решением будет комбинация различных метрик. Такой подход не только обеспечит справедливую оценку каждого товара, но и повысит эффективность вашей рекомендательной системы, улучшая пользовательский опыт. Предлагаю вам активно взаимодействовать с коллегами из бизнес-отделов, чтобы определить, какие из метрик наиболее критичны для вашей стратегии. Такой многофакторный анализ позволит вашей системе выдавать более релевантные и эффективные рекомендации, удовлетворяющие запросы бизнеса и клиентов.