Data Science
Нужна помощь в понимании AUC-ROC кривой
00
Вопрос или проблема Я студент, работающий над созданием предиктивной модели. Оценивая разные модели, я заметил, что в некоторых случаях AUC составляет около 0.75, но ROC-кривая располагается ниже линии случайного предположения.
Data Science
Вопрос о важности перестановки – все нули для признаков
00
Вопрос или проблема У меня есть следующий код: from sklearn.inspection import permutation_importance result = permutation_importance( search, new_X_test, Y_test, scoring='accuracy', n_repeats=5, random_state=42, n_jobs=-1 ) importance_scores = result.
Data Science
Советы по предсказательной модели прогнозирования
00
Вопрос или проблема Я работаю в компании, которая занимается государственными субсидиями и грантами, и в настоящее время сталкиваюсь с проблемой прогнозирования. Каждый год выделяется фиксированная сумма на различные мероприятия, и моя задача — прогнозировать
Data Science
Почему-то появляется странная ошибка при гипернастройке моей модели.
00
Вопрос или проблема Я надеялся настроить мою модель decisiontree, однако я постоянно сталкиваюсь с этой ошибкой: TypeError: DecisionTreeClassifier() получил неожиданный аргумент ‘criterion’ вот что я попытался сделать: def randomsearch(): data = pd.
Data Science
Проблема прогноза продаж — можно ли использовать уровень запасов в качестве признака?
00
Вопрос или проблема Я работаю над проектом, чтобы предсказать будущие продажи продуктов нашей компании, чтобы цепочка поставок имела лучшее представление о том, сколько нужно пополнить запасы. Подробная информация о модели, над которой я работаю: Модель
Data Science
Предсказание t+1 из набора последовательностей
00
Вопрос или проблема Предположим, у меня есть эксперимент, в котором я отпускаю одну крысу в лабиринт и жду, пока она дойдет до конца. Скажем, я также отслеживаю положение этой крысы в лабиринте в различные моменты времени. Давайте проделаем это $n$ раз.
Data Science
Каковы следующие шаги после предсказания ML и как действовать дальше?
00
Вопрос или проблема Я обучил модель машинного обучения с хорошей точностью, но что дальше? Мне сложно ответить на этот вопрос: как вы представите свою модель? Какую платформу вы используете? Как вы обеспечиваете непрерывное обучение модели?
Data Science
Почему LinearRegressionWithSGD в Spark работает очень медленно локально?
00
Вопрос или проблема Я уже некоторое время пытаюсь запустить линейную регрессию с помощью SGD, которая находится в Spark mllib, и испытываю огромные проблемы с производительностью. Все примеры, которые я рассматривал, имеют число итераций, равное 100
Data Science
Алгоритм прогнозирования для данных с высокой случайностью.
00
Вопрос или проблема У меня есть данные по заказам за предыдущий год, содержащие информацию о продукте и продавце, продавшем продукт. У меня есть информация о продукте, категории продукта, продавце, адресе доставки, цене и т. д.
Data Science
Методы прогнозирования/предсказания для качественных данных?
00
Вопрос или проблема У меня есть набор данных о предупреждениях о продуктах питания, состоящий из номинальных качественных переменных, таких как тип предупреждения, страна происхождения, предпринятые действия и т.д., а также дата записи предупреждения.
Data Science
Предсказание следующего события на основе бинарного.
00
Вопрос или проблема У меня нет опыта в статистике или машинном обучении. У меня есть массив True/False, описывающий занятие открытых общественных пространств. +---------------------+ | index | Value | +---------------------+ | 0 | True | | 1 | True |
Data Science
Включите время как переменную в регрессионную модель.
00
Вопрос или проблема В настоящее время я работаю над проблемой регрессии, которая требует предсказать стоимость основного средства. Я использовал несколько переменных для этого и вывел предсказанную стоимость. Однако мой руководитель захотел, чтобы я включил
Data Science
Может ли простая нейронная сеть предсказать вывод 0 или 1, смотря только на последний ввод?
00
Вопрос или проблема Я написал простую нейронную сеть, которая работает аналогично многим примерам на C#, которые я видел в интернете. Она использует веса и смещения и может быть обучена с помощью обратного распространения ошибки.
Data Science
Отрицательный R2_score Плохие прогнозы для моей задачи прогнозирования продаж с использованием LightGBM.
00
Вопрос или проблема Мой проект заключается в попытке предсказать количество продаж для конкретного товара в течение всего года. Я использовал пакет LightGBM для проведения прогнозов. Параметры, которые я установил, следующие: params = { 'nthread': 10
Data Science
Проблема регрессии – слишком сложна для градиентного спуска.
00
Вопрос или проблема Я пытаюсь предсказать значения температур как функцию времени и различных параметров. Кривая температуры выглядит как “рампа” с некоторыми “гауссовыми пиками” на регулярных интервалах.
Data Science
Почему модель для набора данных может давать разные результаты среднеквадратичной ошибки?
00
Вопрос или проблема Я пытаюсь получить сертификат Data Scientist Associate от DataCamp. У меня возникла проблема с пробным экзаменом, предоставленным для практики перед Практическим Экзаменом. Я предоставил детали ниже. Буду очень признателен за вашу помощь.
Data Science
Рекомендуется ли использовать PCA для группировки признаков в категории?
00
Вопрос или проблема Я приведу простой пример. Предположим, вас наняла транспортная компания предсказать, сколько лет прослужат их грузовики. У них есть инвентарь из 200 грузовиков, и компания требует от вас использования 80 характеристик в вашей модели.
Data Science
Существует ли какая-либо модель временных рядов, которая обрабатывает данные с переменной частотой?
00
Вопрос или проблема Цель: Предсказать желтые точки (желтые события появляются с разной частотой). Но мне сложно найти хорошую модель для этого случая. Большинство алгоритмов временных рядов работают с данными, имеющими одинаковую частоту (например, ежедневно/каждые 10 секунд).
Data Science
Ограждения модели
00
Вопрос или проблема Предположим, я создаю модель машинного обучения для приложения, где нет необходимости делать предсказания для всех новых образцов, и, получив новый образец, лучше вообще не делать предсказания, если есть опасения, что предсказание
Data Science
Как учесть неопределенность коэффициентов модели в интервале прогнозирования множественной линейной регрессии
00
Вопрос или проблема Я имею дело с моделированием небольших экспериментальных наборов данных. Поскольку большинство экспериментальных работ не генерируют тысячи образцов, а скорее всего лишь несколько, мне нужно быть изобретательным в том, как справляться