Data Science
Как построить множественную регрессию с использованием числовых и категориальных признаков?
00
Вопрос или проблема Существует необходимость оценить среднегодовой объем суточного трафика (AADT). У нас есть много данных о скоростях автомобилей за несколько лет. Замечено, что AADT зависит от среднего количества таких выборок за некоторое время, поэтому
Data Science
Многофункциональный One-Hot-кодировщик с переменным количеством экземпляров признаков
00
Вопрос или проблема Предположим, у нас есть данные в таких экземплярах: [ [15, 20, ("банан","яблоко","огурец"), ...], [91, 12, ("апельсин","банан"), ...], ... ] Мне интересно, как я могу закодировать третий элемент этих данных.
Data Science
Сколько признаков — это слишком много при использовании методов выделения признаков?
00
Вопрос или проблема Теперь, конечно, не существует идеального числа, так как каждая задача уникальна, но я несколько дней искал в Google, ChatGPT и на YouTube ответ на этот вопрос и постоянно получал противоречивые отзывы. Некоторые источники говорят
Data Science
Я пытаюсь построить модель логистической регрессии.
00
Вопрос или проблема У меня есть данные временного ряда о том, как семья тратит деньги на разные продукты. Каждый продукт отнесён к категории (это может быть путь категории из двух уровней), например, (Еда > Курица) или (Личные принадлежности > Макияж).