Data Science
Как должен выглядеть набор данных для прогнозирования временных рядов.
00
Вопрос или проблема Как должен выглядеть набор данных для прогнозирования временных рядов? Могу ли я сделать прогнозирование временных рядов с набором данных, который содержит информацию о квартирах с рекламных сайтов, полученную с помощью: веб-скрейпинга
Data Science
Модель частичных наименьших квадратов возвращает отрицательные значения для кривых или сплайновидного выхода.
00
Вопрос или проблема У меня есть набор данных, в котором измеряется разная высота мяча для баскетбола, брошенного на 4 промежутка времени: 1 секунда, 2 секунды, 3 секунды, 4 секунды. Признаки включают вес, рост, годы участия в спорте.
Data Science
Сравнимо ли регрессионное дерево решений с локально взвешенной регрессией?
00
Вопрос или проблема Я новичок в методе деревьев решений. Для модели регрессии деревьев решений, она просто подстраивает кусочную ступенчатую функцию под данные? Когда и почему люди предпочитают её по сравнению с традиционной регрессией, такой как регрессия
Data Science
Как я могу улучшить точность своей регрессионной модели?
00
Вопрос или проблема Для университетского проекта я пытаюсь подогнать последовательную модель Keras к нескольким тысячам данных, которые находятся примерно в диапазоне $y \in [-0.03,0.03]$ и имеют область $x \in (0, 409.6)$. Я использую следующую модель
Data Science
Учитывая модель регрессии с множеством переменных признаков, какие инструменты вы бы использовали, чтобы определить, какие переменные признаков добавляют наибольшую дисперсию?
00
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Декомпозиция R-квадрат или VIF
00
Вопрос или проблема В контексте множественной регрессии меня интересует, есть ли способ разложить $$VIF_i = 1/(1-R_i^2)$$, где $R_i^2$ — это коэффициент детерминации, полученный из регрессии зависимой переменной = i и независимыми переменными, являющимися всеми другими факторами.
Data Science
Попытка определить степень полинома для полиномиальной регрессии
00
Вопрос или проблема Я пытаюсь предсказать вес новорожденного, используя полиномиальную регрессионную модель. Сначала мне нужно понять, какая степень полинома лучше всего подходит для моих данных. Для этого я разделил свой набор данных на обучающую выборку
Data Science
Показывает ли этот результат переобучение?
00
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью gridsearch, следующие. Я также построил кривую обучения для нее. Вы считаете, что эта модель имеет сильное переобучение? Среднее значение целевых переменных равно 850.
Data Science
Как определить выбросы на основе регрессии с логарифмическим масштабом?
00
Вопрос или проблема Я сталкиваюсь с проблемой, когда мне нужно обнаружить выбросы в сборе данных. Цель состоит в том, чтобы выявлять выбросы по переменной Y на основе ее связи с переменной X. Для этого я сделал следующее: Построил график в логарифмическом
Data Science
Сдерживающие значения или сглаживание результатов при подгонке модели
00
Вопрос или проблема Я работаю над обучением сети для предсказания направления прихода, и у меня возникла проблема: независимо от того, какая у меня сеть (ResNet 18 – 101, CRNN, CNN и т. д.), мои результаты склоняются к одному небольшому диапазону
Data Science
Как интегрировать новые функции в существующую модель машинного обучения?
00
Вопрос или проблема Допустим, мы обучили регрессионную модель $M$ на фиксированном наборе $n$ признаков, $F_1,F_2,…,F_n$ на определенном наборе данных $G$. Теперь предположим, что после обучения модели для поднабора $H\subset G$ становятся доступными
Data Science
Метрика регрессии для набора данных с широким диапазоном значений целевой переменной.
00
Вопрос или проблема У меня есть набор данных из около 100 изображений. Каждое изображение имеет метку, которая является числовым значением. Модели должны учиться на изображениях, чтобы предсказывать числовые метки. Однако проблема в том, что я не знаю
Data Science
Найти повторяющиеся даты в небольшом наборе (и избавиться от неповторяющихся)
00
Вопрос или проблема Мне нужна помощь в анализе проблемы категоризации. Дан набор дат (небольшой набор: максимум 20 элементов), я хотел бы сгруппировать даты, которые равномерно распределены (с учетом допустимой погрешности). Это могут быть, например
Data Science
Техники адаптивного предсказания с обратной связью в развивающемся пространстве признаков
00
Вопрос или проблема Я работаю над задачей прогнозирования, где целевая переменная 𝑦 извлекается из нормального распределения, а связь между непрерывным пространством признаков 𝑋 и 𝑦 остается стабильной со временем. Однако целевые значения (например, среднее
Data Science
Существует ли метрика оценки для регрессии (временных рядов), которая оценивает, насколько точна форма “кривой”?
00
Вопрос или проблема Я пытаюсь предсказать значение y. Меня в основном интересует, когда его пики будут и как будет выглядеть общая кривая за день. Менее важно, чтобы фактически предсказанные значения были точными. Чуть преувеличивая: мне все равно, если
Data Science
Метрики регрессии интерпретации
00
Вопрос или проблема Я провел анализ набора данных с помощью модели случайного леса. Результаты следующие. Почему MSE крайне высок, но коэффициент детерминации (r2) показывает точность около 83-84%? Это нормально и связано с набором данных, или это указывает на проблему?
Data Science
Как обработать временные ряды с перекрытием и различным числом признаков?
00
Вопрос или проблема У меня есть две машины, Машина А и Машина Б, собирающие временные ряды данных. Первая машина работает каждый день и собирает 5 характеристик, а вторая работает каждый пятницу и собирает 10 характеристик. Я пытаюсь применить это к модели
Data Science
Модель логистической регрессии на тестовом наборе данных – ошибки в данных о Титанике.
00
Вопрос или проблема Я построил модель на наборе данных Титаник с помощью логистической регрессии, и она хорошо предсказывает на обучающем наборе, но, к сожалению, я не могу применить это на тестовом наборе данных. Вот код для справки: training = training[['PassengerId','Sex','Embarked','Pclass','Age','SibSp','Survived']] # 0.
Data Science
Закупка (со скидкой) продуктов, которые хотят клиенты
00
Вопрос или проблема Цель: сгенерировать список из 100 товаров по каждой категории (например, мода, электроника), которые команды должны закупить, сделать скидки и разместить на сайте в течение определенного периода. Вы можете предположить, что все клиенты