Создание функции для определения популярности

Question 1

Я разрабатываю систему рекомендаций, в которой есть несколько категорий. Я хотел бы узнать, насколько популярен продукт в каждой категории. Для этого я рассматриваю вероятность как один из факторов. Например, у меня есть 3 категории ($C1$,$C2$,$C3$), так что я рассчитываю:

(Количество раз, когда конкретный товар в C1 был куплен)/(общее количество товаров, купленных из C1)

Это дает мне вероятность каждого товара в пределах категории. Кроме того, я также пытаюсь учесть:

(Общее количество раз, когда товар был куплен/общее количество раз, когда он был просмотрен)

Тем не менее, я не понимаю, как использовать соотношение покупок/просмотров с вероятностью. Кроме того, какие другие факторы я могу учесть?

Question 2

Вам нужно встать на место бизнесменов и регулярно общаться с людьми из этого отдела, пытаясь понять, каковы потребности бизнеса. В электронной коммерции ваша вторая метрика — это Коэффициент конверсии и он определяется как:

CR = Заказы/Просмотры*

Обратите внимание, что существует две вариации Просмотры. Одна из Страницы списка продуктов (PLP), которая в основном известна как Впечатление, или та, которая происходит из Страницы деталей продукта (PDP), на которую пользователь фактически попадает. Последняя более распространена в расчете CR.

Первый показатель, то есть популярность, который мне как-то понравился, можно использовать. Только будьте осторожны, он будет зависеть от количества доступных товаров в этой категории.

В общем, я считаю полезным думать о крайних случаях, когда вы разрабатываете новые меры, и смотреть, является ли результат желаемым. Что я имею в виду под крайними случаями, давайте возьмем ваш балл популярности, по вашему определению, например. Представьте следующие два сценария:

популярность товара 1 = 1/2 (очень ограниченное количество товаров в этой категории, где находится товар 1)
популярность товара 2 = 1000/2000 (большое количество товаров в этой категории, где находится товар 2)

То, что вы здесь видите, выглядит вполне нормально с точки зрения математики по исходному определению. Однако с точки зрения рекомендаций/бизнеса это означает, что у вас похожие оценки двух товаров из двух разных категорий. Здесь бизнес может вмешаться и сказать, что у нас гораздо больше ассортимента в категории, где находится товар 2, и часто товары в этой категории находятся на складе или имеют более быструю доставку и т. д., тогда мы предпочли бы, чтобы наши товары оттуда рекомендовали в первую очередь. В этот момент вы понимаете, что, хотя результаты кажутся разумными, по крайней мере, согласно определению популярности, они не учитывают определенные аспекты.

Другие идеи: Я заметил, что вы склоняетесь к использованию нескольких оценок. Это отличная идея. Наличие нескольких факторов может учесть эти нюансы и одновременно удовлетворить несколько бизнес-потребностей. Например, наличие как CR, так и популярности. Или можно подумать о вклад каждого товара в прибыль для бизнеса и учесть это. Представьте, у вас есть система, которая дает равные шансы рекомендовать iPhone или беспроводную мышь, однако iPhone приносит гораздо больше прибыли бизнесу, тогда вам может понадобиться учесть этот фактор тоже. Вы также можете обратить внимание на Впечатление, о котором я упоминал, если оно доступно из вашего отслеживания. Рейтинг товара рейтинги, доставка, Добавить в корзину, Список желаемого или Время, проведенное над товаром — это другие вещи, над которыми стоит подумать. Проверьте этот пост, чтобы получить другие идеи о том, как примерно все это делается на Amazon. Надеюсь, это поможет.

Создание функции для определения популярности

Вопрос или проблема

Ответ или решение

Определение метрик популярности продукции

Комбинация метрик

Подходящие факторы для анализа

Резюме