Data Science
Один хот и взаимодействие один хот на нескольких категориальных.
00
Вопрос или проблема Мне интересно, есть ли смысл создавать комбинированные признаки из нескольких категориальных переменных, когда отдельные категориальные переменные уже закодированы методом one-hot? Простой пример: есть переменная P с категориями {X
Data Science
Мне стоит получить фиктивные переменные, а затем посмотреть на многоколлинеарность?
00
Вопрос или проблема У меня есть данные, которые включают непрерывные и категориальные признаки. Задача заключается в регрессии, и я ищу способ удалить признаки, которые сильно коррелируют с другими признаками (мультиколлинеарность).
Data Science
Можно ли заменить категориальные данные на числа в задачах классификации?
00
Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.
Data Science
Подготовка игрового датасета – one-hot-кодирование против min-max-нормализации для идентификаторов карт
00
Вопрос или проблема У меня есть набор данных для игры. 5 карт игроков с идентификаторами для игрока 1, 5 карт игроков с идентификаторами для игрока 2. Имена столбцов выглядят как player1_card1_id, …, player1_card5_id, player2_card1_id, …
Data Science
Как делать предсказания по данным, закодированным метками, если конечный пользователь будет вводить категориальные данные?
00
Вопрос или проблема Мой набор данных содержит около 29 признаков с 3 метками классов в качестве результата. Среди этих 29 признаков около 24 признаков являются категориальными, я не могу преобразовать каждую категорию в числа, так как в некоторых признаках их более 30.
Data Science
Как подготовить данные, если каждый элемент имеет несколько категорий (например, теги)
00
Вопрос или проблема Я работаю над рекомендательной системой, которая будет рекомендовать фильмы пользователям. Оценки фильмов Фильм Пользователь Оценка 100 201 5 105 256 8 … … … Теги фильмов Фильм Тег 100 1 100 2 100 8 105 2 105 5 …
Data Science
Какие хорошие способы визуализации данных с одной горячей кодировкой?
00
Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать наши данные, закодированные методом “one-hot”, чтобы увидеть, как модель обучается. Какие хорошие техники для этого существуют?