Data Science
Проблема вычисления коэффициента кликов (CTR)
00
Вопрос или проблема Итак, я выполняю практическое задание для собеседования в компании, и один из вопросов заключается в том, чтобы вычислить CTR для алгоритма сортировки. Мой вопрос: следует ли мне исключить операции, в которых не было показано никаких
Data Science
Система рекомендаций, которая соединяет пользователей друг с другом, стоит ли выбрать контентный метод или коллаборативную фильтрацию?
00
Вопрос или проблема Я пытаюсь создать систему, где пользователь приходит на платформу, выбирает тему (несколько заранее определенных тем), и тогда мы соединяем его с любым случайным пользователем онлайн, который выбрал ту же тему.
Data Science
Нужно ли мне считывать всю базу данных для рекомендательной системы?
00
Вопрос или проблема Допустим, у меня есть база данных примерно со 100000 строк. Я хочу создать систему рекомендаций на основе контента. Нужно ли мне действительно считывать всю базу данных для вычисления схожести? Это было бы очень дорого делать в облачных
Data Science
Как оценить отсутствующие значения при расчете NDCG
00
Вопрос или проблема Я хотел бы сравнить методы рекомендаций, используя метрику NDCG на датасете MovieLens. В задаче ранжирования цель состоит в том, чтобы ранжировать предметы на основе их релевантности для пользователя. Модели ранжирования могут изучаться
Data Science
Как рекомендательная система YouTube справляется с новыми видео?
00
Вопрос или проблема Я пытаюсь понять статью о рекомендательной системе Youtube: https://static.googleusercontent.com/media/research.google.com/en//pubs/archive/45530.pdf Однако в модели генерации кандидатов размер выхода softmax фиксирован.
Data Science
Определение похожих пользователей по их поведению на сайте.
00
Вопрос или проблема Мне нужно найти пользователей с похожим поведением на сайте для персонализированных рекомендаций. У меня есть большая база данных действий пользователей на сайте, собранная с помощью Retentioneering. Мне нужно создать систему, которая
Data Science
Изучение сходства представлений
00
Вопрос или проблема Меня интересует платформа для изучения сходства различных входных представлений на основе некоторого общего контекста. Я изучал word2vec, SVD и другие рекомендательные системы, которые более или менее делают то, что мне нужно.
Data Science
Об офлайн-оценке системы рекомендаций
00
Вопрос или проблема Существует три основных способа оценки рекомендательных систем: офлайн, онлайн и пользовательское исследование. В большинстве академических статей используется офлайн-оценка для демонстрации улучшений: Они разбивают офлайн-датасет
Data Science
Инициализировать систему рекомендаций без набора данных.
00
Вопрос или проблема Рассмотрим платформу для рекомендаций контента на основе истории пользователя. Контентом являются книги и статьи, а под историей я имею в виду, что пользователь читал, что он поделился и так далее. Я знаю, что существует много исследований
Data Science
Нейронная сеть – Разреженность коллаборативной фильтрации и моделирование задачи прогноза
00
Вопрос или проблема Я довольно новичок в машинном обучении и, кстати, в нейронных сетях, но последние несколько дней решил попробовать решить довольно классическую и практическую задачу нейронных сетей/машинного обучения, такую как рекомендательные системы.
Data Science
Когда следует предпочесть классификатор вместо ранжировщика в системах рекомендаций или поискового ранжирования?
00
Вопрос или проблема Я готовлюсь к собеседованию по проектированию систем машинного обучения и у меня есть вопрос о выборе моделей в рекомендательных системах и подобных областях, таких как ранжирование поиска. Когда мы представляем несколько элементов
Data Science
Модель рекомендательной системы предсказывает длительность просмотра для каждой пары user_id-video_id.
00
Вопрос или проблема Я просто хочу спросить, можно ли использовать библиотеку Surprise (алгоритм SVD) для построения рекомендательной системы, которая предсказывает длительность просмотра для пары user_id и video_id? У меня есть набор данных, содержащий
Data Science
Как смоделировать систему рекомендателей с учителем с изменяющимися данными
00
Вопрос или проблема Предположим, что есть 2000 фильмов, и компания хочет рекомендовать некоторые фильмы (например, максимум 5 фильмов) каждому посетителю. Цель состоит в том, чтобы научиться предсказывать, какой фильм будет выбран, если предложен определенный набор фильмов.
Data Science
Использование отрицательного коэффициента корреляции в алгоритме Пирсона для рекомендательных систем
00
Вопрос или проблема Я جديد в системах рекомендаций и пытаюсь найти похожих пользователей на базовых пользователей для фильтрации на основе пользователей. Когда я вычислял коэффициент сходства между двумя пользователями (на основе их оценок с использованием
Data Science
Как использовать тестовый набор данных для оценки алгоритма рекомендательной системы
00
Вопрос или проблема Я новичок в системе рекомендаций и пытаюсь создать одну из них, используя метод коллаборативной фильтрации на основе предметов. В настоящее время я пытаюсь оценить/измерить результаты, используя MAE. У меня есть один шаг, который неясен
Data Science
Должен ли я обучать модель на всей выборке в системах рекомендаций?
00
Вопрос или проблема После прочтения нескольких учебников и статей о рекомендательных системах, я не могу понять, следует ли мне разбивать набор данных на обучающую и тестовую выборки или использовать весь набор данных, чтобы позволить модели запомнить
Data Science
precision@k и recall@k
00
Вопрос или проблема Как правило, я знаком с метриками оценки точности и полноты, но, как вы знаете, recall@k и precision@k – это разные вещи, используемые в оценках ранжирования, особенно в системах рекомендаций. Я проверил много источников, я понял
Data Science
Совпадение документов с большим приоритетом для определенных признаков, чем для других.
00
Вопрос или проблема Я работаю над системами рекомендаций, где мне нужно сопоставить сходство двух пользователей. Теперь я знаю, что могу использовать векторизатор Tfidf для расчета косинусного сходства между ними. Но теперь предположим, что у меня есть
Data Science
Методы рекомендаций на базе машинного обучения, где не все пользователи находятся в обучающем наборе данных.
00
Вопрос или проблема У меня есть список заказов, который содержит список товаров. Мне нужно использовать машинное обучение, чтобы предлагать клиентам другие товары, основываясь исключительно на их корзине на момент оформления заказа, учитывая историю размещенных заказов.
Data Science
Способ проведения голосования и выбора кандидата на основе ближайших соседей
00
Вопрос или проблема Я работаю над проектом, где использую FAISS для поиска n соседних векторов на основе вектора запроса. Обрабатываемые данные являются текстовыми и преобразуются с использованием модели машинного обучения для создания вектора перед тем, как попасть в FAISS.