Data Science
Как использовать модель предсказания после кодирования One-hot?
00
Вопрос или проблема Я создал модель прогнозирования для этого набора данных >>df.head() Service Tasks Difficulty Hours 0 ABC 24 1 0.833333 1 CDE 77 1 1.750000 2 SDE 90 3 3.166667 3 QWE 47 1 1.083333 4 ASD 26 3 1.000000 >
Data Science
несоответствие между числами y и x в разделе на обучающую и тестовую выборки
00
Вопрос или проблема Я нов в области науки о данных и нуждаюсь в помощи по следующему вопросу: Я работаю с набором данных, который состоит как из категориальных, так и из числовых значений. Сначала я объединил два файла (обучающий и тестовый), чтобы применить
Data Science
Когда использовать кодирование меток (Label Encoder) и бинарное кодирование (One Hot encoding) с целевыми переменными?
00
Вопрос или проблема Как говорится в заголовке, когда использовать Label Encoder и One Hot кодирование с целевыми переменными? Это зависит от используемой модели и, возможно, что более важно, от используемого программного обеспечения.
Data Science
Как эффективно уменьшить размерности категориальных значений, закодированных методом one-hot?
00
Вопрос или проблема В настоящее время я работаю над проектом, в котором использую LSTM для обучения и предсказания последовательностей категориальных данных. Мой набор данных состоит из последовательностей переменной длины элементов $s_i = [x_{i_0}, x_{i_1}, …
Data Science
Один хот и взаимодействие один хот на нескольких категориальных.
00
Вопрос или проблема Мне интересно, есть ли смысл создавать комбинированные признаки из нескольких категориальных переменных, когда отдельные категориальные переменные уже закодированы методом one-hot? Простой пример: есть переменная P с категориями {X
Data Science
Мне стоит получить фиктивные переменные, а затем посмотреть на многоколлинеарность?
00
Вопрос или проблема У меня есть данные, которые включают непрерывные и категориальные признаки. Задача заключается в регрессии, и я ищу способ удалить признаки, которые сильно коррелируют с другими признаками (мультиколлинеарность).
Data Science
Можно ли заменить категориальные данные на числа в задачах классификации?
00
Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.
Data Science
Подготовка игрового датасета – one-hot-кодирование против min-max-нормализации для идентификаторов карт
00
Вопрос или проблема У меня есть набор данных для игры. 5 карт игроков с идентификаторами для игрока 1, 5 карт игроков с идентификаторами для игрока 2. Имена столбцов выглядят как player1_card1_id, …, player1_card5_id, player2_card1_id, …
Data Science
Как делать предсказания по данным, закодированным метками, если конечный пользователь будет вводить категориальные данные?
00
Вопрос или проблема Мой набор данных содержит около 29 признаков с 3 метками классов в качестве результата. Среди этих 29 признаков около 24 признаков являются категориальными, я не могу преобразовать каждую категорию в числа, так как в некоторых признаках их более 30.
Data Science
Как подготовить данные, если каждый элемент имеет несколько категорий (например, теги)
00
Вопрос или проблема Я работаю над рекомендательной системой, которая будет рекомендовать фильмы пользователям. Оценки фильмов Фильм Пользователь Оценка 100 201 5 105 256 8 … … … Теги фильмов Фильм Тег 100 1 100 2 100 8 105 2 105 5 …
Data Science
Какие хорошие способы визуализации данных с одной горячей кодировкой?
00
Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать наши данные, закодированные методом “one-hot”, чтобы увидеть, как модель обучается. Какие хорошие техники для этого существуют?