pipelines
Data Science
Вопрос или проблема Когда я создаю конвейер преобразования данных для набора данных, я постоянно получаю ошибку: “все размеры входного массива, за исключением оси конкатенации, должны точно совпадать, но по измерению 0, массив в индексе 0 имеет размер 1”
Data Science
Вопрос или проблема Я работаю над проектом Глубокого Обучения и сталкиваюсь с проблемой размера набора данных. Я хочу создать конвейер для видео набора данных [Sequence Matters]. Потому что, если я пытаюсь загрузить весь набор данных, то TensorFlow выдает
Data Science
Вопрос или проблема Я использую gridsearchcv для настройки параметров моей модели, а также использую pipeline и кросс-валидацию. Когда я запускаю модель для настройки параметра XGBoost, она возвращает nan. Однако, когда я использую тот же код для других
Data Science
Вопрос или проблема Существует множество “проводок”, которые существуют в современном мире Data Science: данные (“подъем и перенос”, курирование, согласование?) вывод моделирование машинное обучение (в отличие от 2 и 3?
Data Science
Вопрос или проблема Я строю модель NLP для предсказания типа языка (C/C++/C#/Python…) для данного кода. Теперь мне нужно предоставить объяснение для предсказания моей модели. Например, следующий пользовательский ввод написан на Java, и модель это
Data Science
Вопрос или проблема Цель того, что я пытаюсь достичь здесь, заключается в том, чтобы вывод содержал все use_cols, но модель строилась только для вычислений на categorical_features. Затем вывод будет использоваться для предсказания и сравнения предсказания ‘
Data Science
Вопрос или проблема Закрыто. Этот вопрос требует подробностей или пояснений. В данный момент он не принимает ответы. Хотите улучшить этот вопрос? Добавьте подробности и уточните проблему, отредактировав этот пост. Закрыто 4 часа назад.
Data Science
Вопрос или проблема Надеюсь, кто-то сможет мне помочь разобраться с этим. Я наткнулся на множество различных ресурсов о вложенной кросс-валидации, но, похоже, я запутался в том, как выбрать модель и правильно построить доверительные интервалы для процесса обучения.
Data Science
Вопрос или проблема В программной инженерии шаблон проектирования — это общее, многократно используемое решение для общей проблемы в проектировании программного обеспечения. Это не законченный кусок кода, а скорее шаблон или лучшая практика, которую можно
Data Science
Вопрос или проблема Предположим, у меня есть набор данных, который содержит временную метку (нестандартная колонка временной метки без формата даты и времени) в качестве одного признака и count в качестве метки/цели для предсказания в следующем формате
Data Science
Вопрос или проблема Я пришёл из области программной инженерии и хорошо знаком с лучшими паттернами проектирования в этой сфере, но в области науки о данных я чувствую, что совершаю элементарные ошибки в проектировании паттернов.
Data Science
Вопрос или проблема У меня есть следующее: train_set, test_set = train_test_split(arbres_df, test_size=0.2, random_state=42) Это старая train_test_split, которую мы знаем. А затем я разделяю признаки и целевую переменную: train_feat = train_set.