regression
Data Science
Вопрос или проблема Как должен выглядеть набор данных для прогнозирования временных рядов? Могу ли я сделать прогнозирование временных рядов с набором данных, который содержит информацию о квартирах с рекламных сайтов, полученную с помощью: веб-скрейпинга
Data Science
Вопрос или проблема У меня есть набор данных, в котором измеряется разная высота мяча для баскетбола, брошенного на 4 промежутка времени: 1 секунда, 2 секунды, 3 секунды, 4 секунды. Признаки включают вес, рост, годы участия в спорте.
Data Science
Вопрос или проблема Я новичок в методе деревьев решений. Для модели регрессии деревьев решений, она просто подстраивает кусочную ступенчатую функцию под данные? Когда и почему люди предпочитают её по сравнению с традиционной регрессией, такой как регрессия
Data Science
Вопрос или проблема Для университетского проекта я пытаюсь подогнать последовательную модель Keras к нескольким тысячам данных, которые находятся примерно в диапазоне $y \in [-0.03,0.03]$ и имеют область $x \in (0, 409.6)$. Я использую следующую модель
Data Science
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Вопрос или проблема В контексте множественной регрессии меня интересует, есть ли способ разложить $$VIF_i = 1/(1-R_i^2)$$, где $R_i^2$ — это коэффициент детерминации, полученный из регрессии зависимой переменной = i и независимыми переменными, являющимися всеми другими факторами.
Data Science
Вопрос или проблема Я пытаюсь предсказать вес новорожденного, используя полиномиальную регрессионную модель. Сначала мне нужно понять, какая степень полинома лучше всего подходит для моих данных. Для этого я разделил свой набор данных на обучающую выборку
Data Science
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью gridsearch, следующие. Я также построил кривую обучения для нее. Вы считаете, что эта модель имеет сильное переобучение? Среднее значение целевых переменных равно 850.
Data Science
Вопрос или проблема Я сталкиваюсь с проблемой, когда мне нужно обнаружить выбросы в сборе данных. Цель состоит в том, чтобы выявлять выбросы по переменной Y на основе ее связи с переменной X. Для этого я сделал следующее: Построил график в логарифмическом
Data Science
Вопрос или проблема Я работаю над обучением сети для предсказания направления прихода, и у меня возникла проблема: независимо от того, какая у меня сеть (ResNet 18 – 101, CRNN, CNN и т. д.), мои результаты склоняются к одному небольшому диапазону
Data Science
Вопрос или проблема Допустим, мы обучили регрессионную модель $M$ на фиксированном наборе $n$ признаков, $F_1,F_2,…,F_n$ на определенном наборе данных $G$. Теперь предположим, что после обучения модели для поднабора $H\subset G$ становятся доступными
Data Science
Вопрос или проблема У меня есть набор данных из около 100 изображений. Каждое изображение имеет метку, которая является числовым значением. Модели должны учиться на изображениях, чтобы предсказывать числовые метки. Однако проблема в том, что я не знаю
Data Science
Вопрос или проблема Мне нужна помощь в анализе проблемы категоризации. Дан набор дат (небольшой набор: максимум 20 элементов), я хотел бы сгруппировать даты, которые равномерно распределены (с учетом допустимой погрешности). Это могут быть, например
Data Science
Вопрос или проблема Я работаю над задачей прогнозирования, где целевая переменная 𝑦 извлекается из нормального распределения, а связь между непрерывным пространством признаков 𝑋 и 𝑦 остается стабильной со временем. Однако целевые значения (например, среднее
Data Science
Вопрос или проблема Я пытаюсь предсказать значение y. Меня в основном интересует, когда его пики будут и как будет выглядеть общая кривая за день. Менее важно, чтобы фактически предсказанные значения были точными. Чуть преувеличивая: мне все равно, если
Data Science
Вопрос или проблема Я провел анализ набора данных с помощью модели случайного леса. Результаты следующие. Почему MSE крайне высок, но коэффициент детерминации (r2) показывает точность около 83-84%? Это нормально и связано с набором данных, или это указывает на проблему?
Data Science
Вопрос или проблема У меня есть две машины, Машина А и Машина Б, собирающие временные ряды данных. Первая машина работает каждый день и собирает 5 характеристик, а вторая работает каждый пятницу и собирает 10 характеристик. Я пытаюсь применить это к модели
Data Science
Вопрос или проблема Я построил модель на наборе данных Титаник с помощью логистической регрессии, и она хорошо предсказывает на обучающем наборе, но, к сожалению, я не могу применить это на тестовом наборе данных. Вот код для справки: training = training[['PassengerId','Sex','Embarked','Pclass','Age','SibSp','Survived']] # 0.
Data Science
Вопрос или проблема Цель: сгенерировать список из 100 товаров по каждой категории (например, мода, электроника), которые команды должны закупить, сделать скидки и разместить на сайте в течение определенного периода. Вы можете предположить, что все клиенты