Data Science
Какие шаблоны проектирования в программной инженерии наиболее часто применяются при создании пайплайнов и других рабочих процессов в области данных, науки о данных и машинного обучения?
00
Вопрос или проблема В программной инженерии шаблон проектирования — это общее, многократно используемое решение для общей проблемы в проектировании программного обеспечения. Это не законченный кусок кода, а скорее шаблон или лучшая практика, которую можно
Data Science
Какой лучший\правильный метод разделения данных во времени для сравнения производительности предсказания будущих данных между регрессорами ML и DL?
00
Вопрос или проблема Предположим, у меня есть набор данных, который содержит временную метку (нестандартная колонка временной метки без формата даты и времени) в качестве одного признака и count в качестве метки/цели для предсказания в следующем формате
Data Science
Какой шаблон проектирования лучше для потоков данных: партиями или по одному?
00
Вопрос или проблема Я пришёл из области программной инженерии и хорошо знаком с лучшими паттернами проектирования в этой сфере, но в области науки о данных я чувствую, что совершаю элементарные ошибки в проектировании паттернов.
Data Science
Отделение данных признаков от целевой переменной в X и y до или после пайплайна?
00
Вопрос или проблема У меня есть следующее: train_set, test_set = train_test_split(arbres_df, test_size=0.2, random_state=42) Это старая train_test_split, которую мы знаем. А затем я разделяю признаки и целевую переменную: train_feat = train_set.