Data Science
Дискриминатор условной GAN с непрерывными метками
00
Вопрос или проблема Хорошо, предположим, у нас есть хорошо помеченные изображения с недискретными метками, такими как яркость или размер, и мы хотим генерировать изображения на их основе. Если бы это было сделано с дискретной меткой, это могло бы выглядеть
Data Science
Функция потерь для вероятностной регрессии
00
Вопрос или проблема Я пытаюсь предсказать вероятность с помощью нейронной сети, но у меня возникают проблемы с тем, чтобы понять, какая функция потерь лучше. Первой мыслью для меня была перекрестная энтропия, но в других ресурсах всегда говорится об этом
Data Science
Разделение данных на обучающую и тестовую выборки для регрессии
00
Вопрос или проблема Я пытаюсь построить регрессионную модель, которая оценивает объем продаж пивного продукта в конкретный день на основе цен на продукт и конкурентов, погоды, времени года и дня недели того конкретного дня. Мой вопрос заключается в том
Data Science
Дифференцируемая функция потерь для задачи ранжирования в регрессионной модели
00
Вопрос или проблема В задаче регрессии нам может потребоваться функция потерь для измерения относительной точности ранжирования между целевыми значениями $y$ и предсказанными значениями $y_{pred}$. Очевидно, что простая MSE не учитывает такие ранговые отношения.
Data Science
Регрессия в машинном обучении для скошенных данных
00
Вопрос или проблема Я пытаюсь построить простую регрессионную модель для начала, но моя переменная Y сильно смещена вправо. Моя Y представляет собой количество просмотров в день для веб-страницы, и все значения выше 0. У меня есть 4 крупных выброса со
Data Science
Увеличение выборки при прогнозировании непрерывной переменной
00
Вопрос или проблема Предположим, я предсказываю цены на продажу домов (непрерывные значения) и у меня есть несколько независимых переменных (числовых и категориальных). Является ли обычной практикой балансировка набора данных, когда категориальные независимые
Data Science
Какой тип GAN будет подходящим для регрессии?
00
Вопрос или проблема Я разработал cGAN для задачи регрессии и предсказания некоторых значений, таких как масса. Я попробовал разные функции активации, оптимизаторы и функции потерь, но моя модель нестабильна, и я не могу получить значимые результаты предсказания.
Data Science
Использование прогнозных значений из унивариантной модели в качестве входных данных для линейной регрессии
00
Вопрос или проблема У меня есть еженедельные временные ряды данных за последние 2 года с переменными "неделя", "расходы на маркетинг", "трафик на сайте" и "выручка". Теперь мне нужно спрогнозировать "потенциальный трафик на сайте" и "потенциальную выручку" на следующие 12 недель.
Data Science
Какой тип GAN будет подходящим для регрессии?
00
Вопрос или проблема Я разработал cGAN для регрессионной задачи и предсказания некоторых значений, таких как масса. Я пробовал разные функции активации и оптимизаторы, а также функции потерь, но моя модель нестабильна, и я не могу получить значимые результаты предсказания.
Data Science
Прогнозирование изменения форм/координат
00
Вопрос или проблема Я пытаюсь найти способ предсказать/рассчитать, как форма (например, контур ледника) изменится в будущем, исходя из ее истории (предыдущей формы) и дополнительных факторов (например, Δтемпературы). В моем примере: у меня есть форма/координаты
Вопросы и ответы
Преобразование NA в другой уровень фактора
00
Вопрос или проблема У меня есть данные, собранные о беременных женщинах. Некоторые данные касаются предыдущих беременностей женщин (например, спрашивается, были ли у них предыдущие крупные дети). Для женщин, которые находятся на первых беременностях
Data Science
Показывает ли этот результат переобучение?
00
Вопрос или проблема Результаты модели случайного леса, которую я настроил с помощью Gridsearch, следующие. Как вы думаете, есть ли у этой модели серьезная переобученность? Среднее значение целевых показателей составляет 850. R2: 0.
Data Science
Как рассчитать стабильный/приростный рост?
00
Вопрос или проблема У меня есть данные по временным рядам для акций с интервалом в одну минуту. Как лучше всего рассчитать инкрементный рост, например, если у меня есть цена акции с 9 утра до 2 дня с интервалом в минуту, как я могу рассчитать инкрементный рост.
Data Science
Почему модель CNN не может хорошо выучить пик из данных
00
Вопрос или проблема Здесь у меня есть два различных набора данных. dataset1 — это данные с платформы силы, а dataset2 — данные о подошвенном давлении. dataset1 имеет размер (2050,2), а dataset2 имеет размер(2050,89). Перед обучением я нормализовал данные
Data Science
Как должен выглядеть набор данных для прогнозирования временных рядов.
00
Вопрос или проблема Как должен выглядеть набор данных для прогнозирования временных рядов? Могу ли я сделать прогнозирование временных рядов с набором данных, который содержит информацию о квартирах с рекламных сайтов, полученную с помощью: веб-скрейпинга
Data Science
Модель частичных наименьших квадратов возвращает отрицательные значения для кривых или сплайновидного выхода.
00
Вопрос или проблема У меня есть набор данных, в котором измеряется разная высота мяча для баскетбола, брошенного на 4 промежутка времени: 1 секунда, 2 секунды, 3 секунды, 4 секунды. Признаки включают вес, рост, годы участия в спорте.
Data Science
Сравнимо ли регрессионное дерево решений с локально взвешенной регрессией?
00
Вопрос или проблема Я новичок в методе деревьев решений. Для модели регрессии деревьев решений, она просто подстраивает кусочную ступенчатую функцию под данные? Когда и почему люди предпочитают её по сравнению с традиционной регрессией, такой как регрессия
Data Science
Как я могу улучшить точность своей регрессионной модели?
00
Вопрос или проблема Для университетского проекта я пытаюсь подогнать последовательную модель Keras к нескольким тысячам данных, которые находятся примерно в диапазоне $y \in [-0.03,0.03]$ и имеют область $x \in (0, 409.6)$. Я использую следующую модель
Data Science
Учитывая модель регрессии с множеством переменных признаков, какие инструменты вы бы использовали, чтобы определить, какие переменные признаков добавляют наибольшую дисперсию?
00
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Декомпозиция R-квадрат или VIF
00
Вопрос или проблема В контексте множественной регрессии меня интересует, есть ли способ разложить $$VIF_i = 1/(1-R_i^2)$$, где $R_i^2$ — это коэффициент детерминации, полученный из регрессии зависимой переменной = i и независимыми переменными, являющимися всеми другими факторами.