Data Science
Непрерывное оценивающее время прибытия
00
Вопрос или проблема Я пытаюсь создать модель для определения времени прибытия отправленного продукта в пункт назначения. Существуют несколько этапов, через которые проходит доставка, поэтому это не просто время в пути от точки А до точки Б.
Data Science
Как создать модель для выбора набора категорий с набором атрибутов?
00
Вопрос или проблема У меня есть несколько сотен категорий, каждая из которых имеет конкретный набор атрибутов с различными значениями (историческими). Проблема, которую мне нужно решить, заключается в том, чтобы выбрать лучший набор категорий из меньшей
Data Science
Ищу пару идей, пожалуйста.
00
Вопрос или проблема У меня есть данные по почтовым зонам, которые включают: Код почтовой зоны Среднее значение аренды за квадратный фут Привязанность к бренду 1 Привязанность к бренду 2 Привязанность к бренду 3 Привязанность к бренду 4 … и так далее Данные
Data Science
Обработка сдвига ковариат и многоколлинеарности в одном наборе данных
00
Вопрос или проблема Проблема связана с регрессионной задачей. Я получаю партии данных из источника эксперимента, который имеет примерно 3 тысячи столбцов. Однако я заметил, что почти 99% столбцов сильно коррелируют друг с другом.
Data Science
С чего мне начать? У меня есть массивные данные (из веб-скрапинга), и я хочу предсказать y по 20 переменным.
00
Вопрос или проблема Я пытаюсь изо всех сил воссоздать алгоритм, который использует компания, обрабатывая все его выводы и добавляя некоторые релевантные переменные (я не смогу полностью его воспроизвести, так как у меня нет данных по запасам).
Data Science
Какой метрикой оценивается направленная производительность в регрессионных моделях?
00
Вопрос или проблема Не уверен, озадачивает ли заголовок или нет. Вот пример: Предположим, мы строим регрессионную модель для предсказания цен на жилье. Однако, вместо того чтобы заботиться о точности предсказания, где MAE, MSE и некоторые другие метрики
Data Science
Обработка непрерывных данных как задачи классификации путем прогнозирования интервалов или квинтилей.
00
Вопрос или проблема В настоящее время у меня есть модель, которая имеет несколько числовых Y или предсказываемых переменных. Пример данных: Y1 Y2 … YN 2710 0.32 … 31231 1710 0.52 … 51231 В настоящее время я использую регрессию (многовыходную
Data Science
Я сталкиваюсь с ошибкой: объект DecisionTreeRegressor не имеет атрибута n_features.
00
Вопрос или проблема Трассировка (самый последний вызов последним): Файл "/usr/local/lib/python3.8/dist-packages/flask/app.py", строка 2073, в wsgi_app ответ = self.full_dispatch_request() Файл "/usr/local/lib/python3.8/dist-packages/flask/app.
Data Science
Подготовка нескольких временных рядов для обучения модели регрессии Keras LSTM
00
Вопрос или проблема У меня есть обучающие данные, организованные в массиве numpy, в котором: * столбец – это признак, последний столбец – это целевая переменная, * каждая строка – это одно наблюдение. Дело в том, что этот 2D массив состоит
Data Science
Назначьте оценку риска в записях в наборе данных.
00
Вопрос или проблема Мне стало интересно, могу ли я создать модель, которая будет присваивать оценку рисков записи, используя в качестве входных данных числовые и категориальные признаки, если у меня есть набор данных с категориальными и числовыми данными
Data Science
Я получаю отрицательный убыток, используя PyCharm, и положительный, используя Google Colab или Kaggle.
00
Вопрос или проблема У меня есть данные в виде изображений и 2 столбца: один содержит значения тангенса, а второй – для указания, являются ли мои значения отрицательными или положительными. У меня есть два выхода: классификация и регрессия.
Data Science
Какая функция потерь является лучшей функцией потерь при использовании регрессии XGB с сильно искаженными данными?
00
Вопрос или проблема Какая функция потерь является лучшей функцией потерь при использовании регрессии XGB с сильно искаженными данными? Искаженность данных очень высока. Я использовал XGBoost с целевой функцией линейной регрессии (но данные были преобразованы
Data Science
Проблема с моей пользовательской функцией потерь: я получаю отрицательное значение потерь в PyCharm и положительное в Google Colab или Kaggle.
00
Вопрос или проблема У меня есть данные в виде изображений и 2 колонок: одна содержит значения тангенсов, а вторая указывает, являются ли мои значения отрицательными или положительными, и у меня есть два вывода: классификация и регрессия.
Data Science
Какой лучший\правильный метод разделения данных во времени для сравнения производительности предсказания будущих данных между регрессорами ML и DL?
00
Вопрос или проблема Предположим, у меня есть набор данных, который содержит временную метку (нестандартная колонка временной метки без формата даты и времени) в качестве одного признака и count в качестве метки/цели для предсказания в следующем формате
Data Science
Сопоставление нового набора данных с заранее определёнными наборами.
00
Вопрос или проблема У меня есть наборы данных, описывающие уровни требований, необходимых для определенных задач. Вот табличный пример: Обратите внимание, что значения данных находятся в диапазоне от 0 до 10. Моя проблема заключается в том, что у меня
Data Science
Почему значение моего предсказателя (непрерывное) идеально коррелирует с моим логит-значением (при проверке предположений модели логистической регрессии)?
00
Вопрос или проблема Вопрос: Почему мое значение предиктора (непрерывное) идеально коррелирует с моим логитным значением (при тестировании предположений модели логистической регрессии)? Код: # линейность в логите для непрерывной переменной: проверьте линейную
Data Science
Ошибка работы с несколькими входами Keras при передаче словаря в model.fit
00
Вопрос или проблема Я работаю над моделью с несколькими входами и выходами. Передача выходов в model.fit в виде словаря работает хорошо, но если я хочу сделать то же самое с входами, я всегда получаю следующую ошибку: Недопустимая форма ввода для входного
Data Science
Обучение нейронной сети для регрессии с гауссовым выходным слоем
00
Вопрос или проблема Как обучить модель нейронной сети, которая выполняет регрессию по реальным значениям, используя гауссовский выходной слой? То есть оценивать параметры среднего и стандартного отклонения предсказания. Поскольку во время тренировки будет
Data Science
Доброта на тестовом или обучающем наборе?
00
Вопрос или проблема Я разделил свой набор данных на обучающую (80%) и тестовую (20%) выборки. Обучил модель логистической регрессии на обучающем наборе. Теперь хочу проверить адекватность модели с помощью хи-квадрат теста на согласие, на каком наборе
Data Science
Разница между феноменом двойного спада и доброкачественным переобучением
00
Вопрос или проблема Я пытаюсь понять разницу между феноменом двойного спуска и доброкачественным переобучением. Двойной спад возникает в модели, когда ошибка на тестах возрастает с увеличением сложности модели после определенной точки, а затем снова уменьшается