Data Science
Можно ли использовать полиномиальные признаки в моделях логистической регрессии и случайного леса?
00
Вопрос или проблема Я работаю с Python, чтобы предсказать ответ на лечение 43 пациентов, используя 10 предикторов в качестве входных данных. Я заметил, что добавление полиномиальных признаков в мои модели дает практически идеальные результаты.
Data Science
Можно ли перекалибровать предсказанные вероятности после использования весов классов?
00
Вопрос или проблема У меня есть классификационные данные с гораздо большим количествомNegative instances чем положительных. Я использовал вес классов в своих моделях и достиг желаемой дискриминации, но предсказанные вероятности из моделей не соответствуют
Data Science
Логистическая регрессия для прогнозирования
00
Вопрос или проблема Я хотел бы спросить о теоретическом подходе к использованию логистической регрессии для данных клиентов и, более конкретно, для прогнозирования оттока (в BigQuery и Python). У меня есть данные о клиентах для интернет-магазина, и я
Data Science
Почему я получаю неправильное предсказание, когда комбинирую два списка образцов, каждый из которых по отдельности дает правильное предсказание?
00
Вопрос или проблема Я программирую на Python. У меня есть два набора образцов. Набор1 содержит образцы класса A, а другой набор, Набор2, содержит образцы класса B. Эти образцы являются частью обучающего набора данных. Когда я предсказываю наборы 1 и 2
Data Science
Соберите нейронную сеть для многовыходной регрессии.
00
Вопрос или проблема У меня есть нейронная сеть, которая принимает около 25 входов и выдает 3 действия. Выходы: дельта X и дельта Y робота и угол робота. После ввода данных в модель я получаю очень разные (и странные) предсказания угла. В чем может быть причина?
Data Science
Улучшение предсказательной способности традиционных индексов сходства узлов с помощью алгоритма Node2Vec
00
Вопрос или проблема Я пытаюсь протестировать возможность улучшения предсказательных способностей традиционных алгоритмов аналогии узлов, таких как коэффициент Жаккара или алгоритм Адамика-Адера, с помощью графовых встраиваний, таких как Node2Vec.
Data Science
Недостающие данные в обучающем наборе и тестовом наборе
00
Вопрос или проблема У меня есть набор данных из N столбцов. Теперь я могу предобрабатывать данные и находить подмножество признаков, которые могу использовать для обучения модели и выполнения предсказаний. В случае, если в обучающих данных отсутствуют
Data Science
Как заполнитьmissing значения в дискретном столбце в прогнозах продаж для компании, занимающейся поставками лекарств.
00
Вопрос или проблема Я работал с набором данных, который содержит данные известной компании по поставкам наркотиков. Первые несколько записей в наборе данных выглядят следующим образом; Другие данные сопутствуют этому (основному) набору данных.
Data Science
Как добавить предыдущие прогнозы для новых прогнозов в LSTM?
00
Вопрос или проблема Я пытаюсь обучить модель на большом последовательном наборе данных, как этот [0.2 0.1 0.1 ..... 0.4 0.8]. Я создаю векторы X длиной 60 для входных данных и скалярные числа Y в качестве меток (это значит, что LSTM читает первые 60 чисел
Data Science
Прогнозирование ежедневного баланса с использованием LSTM и ARIMA
00
Вопрос или проблема У меня есть история ежедневных транзакций человека с 1.01.2022 по 24.06.2024 в csv файле. Данные разделены на обучающую (с 1.01.2022 по 25.05.2024) и тестовую (оставшиеся). Данные представлены следующим образом: Дата Сумма дебета Сумма
Data Science
Прогнозирование отсутствия активности клиентов
01
Вопрос или проблема Не могли бы вы помочь мне с следующим вопросом? У меня есть датафрейм с данными активности клиентов, который выглядит так: Он содержит как минимум 500.000 клиентов и “временной ряд” из 42 месяцев.
Data Science
Почему predict_generator возвращает пустой массив?
00
Вопрос или проблема Я пытаюсь вывести предсказанные метки для моих тестовых данных, но функция predict_generator() возвращает пустой массив. Моя модель: from keras.preprocessing.image import ImageDataGenerator from keras.models import Sequential from keras.
Data Science
Как предсказать значение преимущества в глубоком обучении с подкреплением
00
Вопрос или проблема В данный момент я работаю над коллекцией алгоритмов обучения с подкреплением: https://github.com/lhk/rl_gym Для глубокого Q-обучения необходимо вычислить Q-значения, которые должны предсказываться вашей сетью.
Data Science
Когда регрессионные модели превосходят наивный метод?
00
Вопрос или проблема Период действия вознаграждения истекает через 7 дней. Ответы на этот вопрос имеют право на +150 репутационного вознаграждения. С. М. ищет канонический ответ. Случай 1: У меня есть следующая задача: Обучение на протяжении 3 последовательных
Data Science
Как делать предсказания для нескольких входных образцов одновременно в tf 2 с keras
00
Вопрос или проблема Я довольно запутался в выводе model.predict Когда после обучения я валидирую свою модель на примерно 6000 выборках, я использую следующий псевдокод: model.fit(...) predictions = model.predict(val_set) len(predictions) # == len(val_set)
Вопросы и ответы
матрица путаницы, отображающая только одну сторону для модели предсказания – CNN
00
Вопрос или проблема У меня проблема с матрицей для отображения предсказанных меток для бинарного вывода текстовой классификации. Она показывает, что все предсказания попадают под один класс и не отображает предсказание для класса 1.
Data Science
Тренировка в течение трех последовательных дней для прогнозирования четвертого дня.
00
Вопрос или проблема У меня есть следующая задача: Обучение по последовательным 3 дням для предсказания 4-го дня. Каждый день данных представляет собой один CSV файл, который имеет размеры 24×25. Каждая точка данных в каждом CSV файле является пикселем.
Data Science
Как получить периодичность из данных временных рядов?
00
Вопрос или проблема Я бы хотел создать рекомендательную систему для приложения умного дома. Я собираю данные в базе данных временных рядов. Приложение отслеживает состояние включения/выключения умной лампы и может создавать ежедневные рутины.
Data Science
Несоответствие между предсказаниями кросс-валидации и предсказаниями для unseen данных.
00
Вопрос или проблема У меня возникла проблема с несбалансированным набором данных. Набор данных содержит 20% целей и 80% нецелевых. Я ожидаю, что матрица ошибок будет выглядеть так, когда я передам невидимые данные обученной модели.
Data Science
Прогнозирование последовательности в наборе данных родитель-ребенок
00
Вопрос или проблема У нас есть большая коллекция документов (D), каждый из которых сопровождается набором метаданных (M). В этой коллекции некоторые документы являются родительскими и имеют несколько дочерних документов. Как родительские, так и дочерние