Data Science
Классификация с использованием текстов в качестве признаков
00
Вопрос или проблема Я хочу создать модель классификации для сопоставления клиентов и продуктов. У меня есть описание каждого продукта и каждого клиента, а также метка: клиент *i* купил/не купил продукт *j*. Каждый пример/строка — это пара (клиент, продукт)
Data Science
Почему использовать fit, если уже есть fit_transform?
00
Вопрос или проблема Это последующий вопрос к: Какая разница между fit и fit_transform в моделях scikit-learn? Я хочу узнать, зачем вообще использовать fit, когда у нас есть fit_transform, который намного быстрее, чем использование fit и transform отдельно?
Data Science
Трансформерная сеть классификации предсказывает один и тот же класс.
00
Вопрос или проблема Я разрабатываю нейронную сеть на основе трансформеров для бинарной классификации. Оба класса сбалансированы (по 750k наблюдений для каждого). Во время обучения значение потерь и метрик становится NaN после нескольких батчей (примерно через 50 батчей).
Data Science
Почему моя модель иногда плохо обучается на одних и тех же данных?
00
Вопрос или проблема У меня есть набор данных из 2 классов, каждый из которых содержит 2000 изображений. Я разделил его на 1500 изображений для обучения и 500 изображений для проверки. Это простая структура для целей тестирования, и каждое изображение
Data Science
Целевая функция в модели вознаграждения в Vanilla RLHF является для меня неоднозначной.
00
Вопрос или проблема Я пытаюсь изучить основу Vanilla RLHF. Мне сложно понять целевую функцию в модели награды. Она определяется Если разность логарифмов сигмоиды разности стремится к минимизации, мы всегда должны иметь r(x,y1) >
Data Science
ImageDataGenerator для многозадачного вывода в Keras с использованием flow_from_directory
00
Вопрос или проблема Я создаю многозадачную модель CNN и у меня есть два разных свойства классификации (одно с 10 классами, второе с 5 классами), и моя структура папок выглядит следующим образом: -Train - image1.jpg ... - imageN.
Data Science
Создание карты между N изображениями и N метками с использованием CNN
00
Вопрос или проблема Я видел классификационные CNN, которые обучаются на множестве изображений для подмножества меток (т.е. количество изображений >> количество меток), однако, возможно ли использовать CNN, когда количество изображений равно количеству меток?
Data Science
Проблема с построением простого ящичного графика.
00
Вопрос или проблема Это проблема, с которой я постоянно сталкиваюсь при попытке сделать boxplot в R. Судя по всему, код, который я использую, должен работать, более того, по сравнению с моими записями и другими одноклассниками, кажется, что он такой же. Что я делаю не так?
Data Science
Проблема вычисления коэффициента кликов (CTR)
00
Вопрос или проблема Итак, я выполняю практическое задание для собеседования в компании, и один из вопросов заключается в том, чтобы вычислить CTR для алгоритма сортировки. Мой вопрос: следует ли мне исключить операции, в которых не было показано никаких
Data Science
Почему моя ошибка на стадии валидации может перестать снижаться, в то время как ошибка на стадии обучения продолжает уменьшаться?
00
Вопрос или проблема В своем стремлении узнать немного больше о науке о данных, я извлек из интернета некоторые размеченные данные и пытаюсь классифицировать примеры на один из трех классов. Я сталкиваюсь с проблемой, что независимо от того, какую модель
Data Science
Предсказание t+1 из набора последовательностей
00
Вопрос или проблема Предположим, у меня есть эксперимент, в котором я отпускаю одну крысу в лабиринт и жду, пока она дойдет до конца. Скажем, я также отслеживаю положение этой крысы в лабиринте в различные моменты времени. Давайте проделаем это $n$ раз.
Data Science
Метод k-ближайших соседей, временная тенденция в ошибке
00
Вопрос или проблема У меня есть набор данных, который выглядит вот так: Меня попросили построить алгоритм $k$-ближайших соседей для этого, который я только что закончил строить. У меня есть вопрос по поводу данных, который я не понимаю: замечаете ли вы
Data Science
вопрос о разделении набора данных по атрибутам и меткам
00
Вопрос или проблема Почему набор данных должен использовать X как атрибуты и y как метку? Почему не использовать один X для всего? Вы действительно могли бы использовать один X для всего. Однако ваши модели на следующем этапе ожидают, что признаки и метки
Data Science
Понимание алгоритма обучения архитектуры Трансформера
00
Вопрос или проблема Я долго думал о маскировании в механизме самовнимания декодера в контексте обучения, и это действительно не имеет для меня смысла. Я просмотрел много источников, и они не помогли. Дано предложение-источник и целевое предложение для
Data Science
Мне нужно обучить многоклассовую модель, но у меня небольшой набор данных.
00
Вопрос или проблема У меня есть файл Excel, который содержит два столбца: один с текстовыми фразами и другой, который сообщает мне классификацию от ‘CS1’ до ‘CS8’. Текст выглядит так: "НЕ ПАГТО ПРОВЕНТОС АПОСЕНТАДОРИЯ ЭСПЕЦИАЛ
Data Science
Регрессия на множественных наборах данных с переменной для каждого набора данных
00
Вопрос или проблема У меня есть 10 наборов данных, каждый из которых содержит одни и те же переменные (например, возраст и доход), но разное количество наблюдений. Теперь рассмотрим категориальную переменную $X$, которая может принимать значения $0$ и
Data Science
Классификация, когда классификация предыдущих элементов имеет значение.
00
Вопрос или проблема У меня есть проблема классификации, которую кажется, часто встречают, но я не могу найти название этой задачи и лучший способ моделирования этой проблемы. Допустим, у меня есть серия событий, которые происходят последовательно во времени.
Data Science
Должны ли отбор признаков и отбор модели иметь одинаковое соотношение между набором для разработки и тестовым набором?
00
Вопрос или проблема Как указано в заголовке, после того как я провел отбор признаков, обязательно ли соблюдать то же самое соотношение (между набором для разработки и тестовым набором) в отборе модели? Если я правильно понимаю, вы отобрали определенный
Data Science
Как объединить оценки из двух областей навыков, чтобы поощрять людей с высокими баллами в обеих областях?
00
Вопрос или проблема Я хочу оценивать людей по шкале от 1 до 10, основываясь на их навыках в двух областях, Навык A и Навык B. Наша цель — наградить тех, кто обладает навыками в обеих областях, предоставив им более высокий Комбинированный Балл.
Data Science
Почему точность уменьшается с увеличением порога?
00
Вопрос или проблема Я обучил модель логистической регрессии, используя класс LogisticRegression из scikit-learn. Я работаю с данными о фондовом рынке, поэтому они довольно шумные и сложно что-то предсказать. При построении графика зависимости порога от