Data Science

Классификация с использованием текстов в качестве признаков

00

Вопрос или проблема Я хочу создать модель классификации для сопоставления клиентов и продуктов. У меня есть описание каждого продукта и каждого клиента, а также метка: клиент *i* купил/не купил продукт *j*. Каждый пример/строка — это пара (клиент, продукт)

Data Science

Почему использовать fit, если уже есть fit_transform?

00

Вопрос или проблема Это последующий вопрос к: Какая разница между fit и fit_transform в моделях scikit-learn? Я хочу узнать, зачем вообще использовать fit, когда у нас есть fit_transform, который намного быстрее, чем использование fit и transform отдельно?

Data Science

Трансформерная сеть классификации предсказывает один и тот же класс.

00

Вопрос или проблема Я разрабатываю нейронную сеть на основе трансформеров для бинарной классификации. Оба класса сбалансированы (по 750k наблюдений для каждого). Во время обучения значение потерь и метрик становится NaN после нескольких батчей (примерно через 50 батчей).

Data Science

Почему моя модель иногда плохо обучается на одних и тех же данных?

00

Вопрос или проблема У меня есть набор данных из 2 классов, каждый из которых содержит 2000 изображений. Я разделил его на 1500 изображений для обучения и 500 изображений для проверки. Это простая структура для целей тестирования, и каждое изображение

Data Science

Целевая функция в модели вознаграждения в Vanilla RLHF является для меня неоднозначной.

00

Вопрос или проблема Я пытаюсь изучить основу Vanilla RLHF. Мне сложно понять целевую функцию в модели награды. Она определяется Если разность логарифмов сигмоиды разности стремится к минимизации, мы всегда должны иметь r(x,y1) >

Data Science

ImageDataGenerator для многозадачного вывода в Keras с использованием flow_from_directory

00

Вопрос или проблема Я создаю многозадачную модель CNN и у меня есть два разных свойства классификации (одно с 10 классами, второе с 5 классами), и моя структура папок выглядит следующим образом: -Train - image1.jpg ... - imageN.

Data Science

Создание карты между N изображениями и N метками с использованием CNN

00

Вопрос или проблема Я видел классификационные CNN, которые обучаются на множестве изображений для подмножества меток (т.е. количество изображений >> количество меток), однако, возможно ли использовать CNN, когда количество изображений равно количеству меток?

Data Science

Проблема с построением простого ящичного графика.

00

Вопрос или проблема Это проблема, с которой я постоянно сталкиваюсь при попытке сделать boxplot в R. Судя по всему, код, который я использую, должен работать, более того, по сравнению с моими записями и другими одноклассниками, кажется, что он такой же. Что я делаю не так?

Data Science

Проблема вычисления коэффициента кликов (CTR)

00

Вопрос или проблема Итак, я выполняю практическое задание для собеседования в компании, и один из вопросов заключается в том, чтобы вычислить CTR для алгоритма сортировки. Мой вопрос: следует ли мне исключить операции, в которых не было показано никаких

Data Science

Почему моя ошибка на стадии валидации может перестать снижаться, в то время как ошибка на стадии обучения продолжает уменьшаться?

00

Вопрос или проблема В своем стремлении узнать немного больше о науке о данных, я извлек из интернета некоторые размеченные данные и пытаюсь классифицировать примеры на один из трех классов. Я сталкиваюсь с проблемой, что независимо от того, какую модель

Data Science

Предсказание t+1 из набора последовательностей

00

Вопрос или проблема Предположим, у меня есть эксперимент, в котором я отпускаю одну крысу в лабиринт и жду, пока она дойдет до конца. Скажем, я также отслеживаю положение этой крысы в лабиринте в различные моменты времени. Давайте проделаем это $n$ раз.

Data Science

Метод k-ближайших соседей, временная тенденция в ошибке

00

Вопрос или проблема У меня есть набор данных, который выглядит вот так: Меня попросили построить алгоритм $k$-ближайших соседей для этого, который я только что закончил строить. У меня есть вопрос по поводу данных, который я не понимаю: замечаете ли вы

Data Science

вопрос о разделении набора данных по атрибутам и меткам

00

Вопрос или проблема Почему набор данных должен использовать X как атрибуты и y как метку? Почему не использовать один X для всего? Вы действительно могли бы использовать один X для всего. Однако ваши модели на следующем этапе ожидают, что признаки и метки

Data Science

Понимание алгоритма обучения архитектуры Трансформера

00

Вопрос или проблема Я долго думал о маскировании в механизме самовнимания декодера в контексте обучения, и это действительно не имеет для меня смысла. Я просмотрел много источников, и они не помогли. Дано предложение-источник и целевое предложение для

Data Science

Мне нужно обучить многоклассовую модель, но у меня небольшой набор данных.

00

Вопрос или проблема У меня есть файл Excel, который содержит два столбца: один с текстовыми фразами и другой, который сообщает мне классификацию от ‘CS1’ до ‘CS8’. Текст выглядит так: "НЕ ПАГТО ПРОВЕНТОС АПОСЕНТАДОРИЯ ЭСПЕЦИАЛ

Data Science

Регрессия на множественных наборах данных с переменной для каждого набора данных

00

Вопрос или проблема У меня есть 10 наборов данных, каждый из которых содержит одни и те же переменные (например, возраст и доход), но разное количество наблюдений. Теперь рассмотрим категориальную переменную $X$, которая может принимать значения $0$ и

Data Science

Классификация, когда классификация предыдущих элементов имеет значение.

00

Вопрос или проблема У меня есть проблема классификации, которую кажется, часто встречают, но я не могу найти название этой задачи и лучший способ моделирования этой проблемы. Допустим, у меня есть серия событий, которые происходят последовательно во времени.

Data Science

Должны ли отбор признаков и отбор модели иметь одинаковое соотношение между набором для разработки и тестовым набором?

00

Вопрос или проблема Как указано в заголовке, после того как я провел отбор признаков, обязательно ли соблюдать то же самое соотношение (между набором для разработки и тестовым набором) в отборе модели? Если я правильно понимаю, вы отобрали определенный

Data Science

Как объединить оценки из двух областей навыков, чтобы поощрять людей с высокими баллами в обеих областях?

00

Вопрос или проблема Я хочу оценивать людей по шкале от 1 до 10, основываясь на их навыках в двух областях, Навык A и Навык B. Наша цель — наградить тех, кто обладает навыками в обеих областях, предоставив им более высокий Комбинированный Балл.

Data Science

Почему точность уменьшается с увеличением порога?

00

Вопрос или проблема Я обучил модель логистической регрессии, используя класс LogisticRegression из scikit-learn. Я работаю с данными о фондовом рынке, поэтому они довольно шумные и сложно что-то предсказать. При построении графика зависимости порога от