data-imputation
Data Science
Вопрос или проблема Предположим, у меня есть набор данных из 50 000 записей, из которых примерно 2% отсутствовали изначально. Из того, что я узнал, нам нужно использовать индикаторы для сравнения модели импутации с истинным значением, чтобы проверить
Data Science
Вопрос или проблема В настоящее время я работаю с набором данных IEEE-CIS Fraud Detection, предоставленным через Kaggle, содержащим около 350 признаков и примерно 600 тысяч экземпляров. Однако некоторые признаки имеют большие объемы пропущенных значений
Data Science
Вопрос или проблема У меня есть набор данных под названием full_weather.csv с различными признаками. Я удалил некоторые столбцы, которые не коррелируют с прогнозированием ветра, и я нашел много NaN (нулевых значений в некоторых столбцах).
Data Science
Вопрос или проблема Для упомянутых ниже шагов подготовки данных Обнаружение/обработка выбросов Импутация данных Масштабирование/стандартизация данных Балансировка классов Есть два под Questions Должны ли каждый из этих шагов выполняться после разделения
Data Science
Вопрос или проблема У меня есть набор данных, скажем, с 1 миллионом наблюдений. В качестве глупого примера представим, что мы хотим предсказать, может ли человек стать специалистом по данным или нет (0/1). У меня есть переменные, в которых много пропусков
Data Science
Вопрос или проблема У меня есть набор данных, который представляет собой список длин широт, широт и временных меток. Этот набор данных представляет собой поездку автомобиля. Данные могут содержать пропуски и некоторый шум. Я хочу узнать, какие методы
Data Science
Вопрос или проблема У меня есть данные о населении с Census.gov: Общее население США по возрасту за год с 1940 по 2010 В зависимости от диапазона десятилетий, в данных отсутствуют дискретные значения населения для возрастов старше определенного возраста.
Data Science
Вопрос или проблема На странице [*] 264 описан метод извлечения отсутствующего значения из условного распределения $P(\bf{x}_{mis}|\bf{x}_{obs};\theta)$, которое определяется как: Я не нашел никакой реализации этого подхода в коде. Мой вопрос: как это реализовать?