one-hot-encoding - ответы на вопросы

Data Science

Как использовать модель предсказания после кодирования One-hot?

00

Вопрос или проблема Я создал модель прогнозирования для этого набора данных >>df.head() Service Tasks Difficulty Hours 0 ABC 24 1 0.833333 1 CDE 77 1 1.750000 2 SDE 90 3 3.166667 3 QWE 47 1 1.083333 4 ASD 26 3 1.000000 >

Data Science

несоответствие между числами y и x в разделе на обучающую и тестовую выборки

00

Вопрос или проблема Я нов в области науки о данных и нуждаюсь в помощи по следующему вопросу: Я работаю с набором данных, который состоит как из категориальных, так и из числовых значений. Сначала я объединил два файла (обучающий и тестовый), чтобы применить

Data Science

Когда использовать кодирование меток (Label Encoder) и бинарное кодирование (One Hot encoding) с целевыми переменными?

00

Вопрос или проблема Как говорится в заголовке, когда использовать Label Encoder и One Hot кодирование с целевыми переменными? Это зависит от используемой модели и, возможно, что более важно, от используемого программного обеспечения.

Data Science

Как эффективно уменьшить размерности категориальных значений, закодированных методом one-hot?

00

Вопрос или проблема В настоящее время я работаю над проектом, в котором использую LSTM для обучения и предсказания последовательностей категориальных данных. Мой набор данных состоит из последовательностей переменной длины элементов $s_i = [x_{i_0}, x_{i_1}, …

Data Science

Один хот и взаимодействие один хот на нескольких категориальных.

00

Вопрос или проблема Мне интересно, есть ли смысл создавать комбинированные признаки из нескольких категориальных переменных, когда отдельные категориальные переменные уже закодированы методом one-hot? Простой пример: есть переменная P с категориями {X

Data Science

Мне стоит получить фиктивные переменные, а затем посмотреть на многоколлинеарность?

00

Вопрос или проблема У меня есть данные, которые включают непрерывные и категориальные признаки. Задача заключается в регрессии, и я ищу способ удалить признаки, которые сильно коррелируют с другими признаками (мультиколлинеарность).

Data Science

Можно ли заменить категориальные данные на числа в задачах классификации?

00

Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.

Data Science

Подготовка игрового датасета – one-hot-кодирование против min-max-нормализации для идентификаторов карт

00

Вопрос или проблема У меня есть набор данных для игры. 5 карт игроков с идентификаторами для игрока 1, 5 карт игроков с идентификаторами для игрока 2. Имена столбцов выглядят как player1_card1_id, …, player1_card5_id, player2_card1_id, …

Data Science

Как делать предсказания по данным, закодированным метками, если конечный пользователь будет вводить категориальные данные?

00

Вопрос или проблема Мой набор данных содержит около 29 признаков с 3 метками классов в качестве результата. Среди этих 29 признаков около 24 признаков являются категориальными, я не могу преобразовать каждую категорию в числа, так как в некоторых признаках их более 30.

Data Science

Как подготовить данные, если каждый элемент имеет несколько категорий (например, теги)

00

Вопрос или проблема Я работаю над рекомендательной системой, которая будет рекомендовать фильмы пользователям. Оценки фильмов Фильм Пользователь Оценка 100 201 5 105 256 8 … … … Теги фильмов Фильм Тег 100 1 100 2 100 8 105 2 105 5 …

Data Science

Какие хорошие способы визуализации данных с одной горячей кодировкой?

00

Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать наши данные, закодированные методом “one-hot”, чтобы увидеть, как модель обучается. Какие хорошие техники для этого существуют?