Data Science
Модель предсказывает узкий диапазон значений, но с многообещающими значениями MSE и RMSE; проблемы с нормализацией и метриками ошибок в задаче регрессии.
00
Вопрос или проблема Я работаю над проектом, основанным на обнаружении спектра, где мне нужно предсказывать значения SNR по изображениям спектрограмм. Чтобы обучить и оценить модель, я нормализовал истинные значения SNR и получил приличные значения MSE (0.
Data Science
Регрессия на множественных наборах данных с переменной для каждого набора данных
00
Вопрос или проблема У меня есть 10 наборов данных, каждый из которых содержит одни и те же переменные (например, возраст и доход), но разное количество наблюдений. Теперь рассмотрим категориальную переменную $X$, которая может принимать значения $0$ и
Data Science
Как построить множественную регрессию с использованием числовых и категориальных признаков?
00
Вопрос или проблема Существует необходимость оценить среднегодовой объем суточного трафика (AADT). У нас есть много данных о скоростях автомобилей за несколько лет. Замечено, что AADT зависит от среднего количества таких выборок за некоторое время, поэтому
Data Science
Регрессия ограничивающих рамок без задачи классификации
00
Вопрос или проблема Я использую PyTorch для создания модели, которая обнаруживает определенные объекты на изображении. Я представил свою задачу как регрессию на ограничительные рамки, без какой-либо задачи классификации. Причина заключается в том, что
Data Science
Почему LinearRegressionWithSGD в Spark работает очень медленно локально?
00
Вопрос или проблема Я уже некоторое время пытаюсь запустить линейную регрессию с помощью SGD, которая находится в Spark mllib, и испытываю огромные проблемы с производительностью. Все примеры, которые я рассматривал, имеют число итераций, равное 100
Data Science
Моделирование оптимизации расписания публикаций в социальных сетях
00
Вопрос или проблема Проблема: Я хочу максимизировать эффективность постов в социальных сетях, оптимизируя время их публикации. Текущая модель: X: publishing_datetime, post_attribute_1, ..., post_attribute_n y: performance Желаемая модель: X: post_attribute_1, .
Data Science
Нейронная сеть для регрессии с одной зависимой и одной независимой переменной
00
Вопрос или проблема Я пытаюсь создать простую нейронную сеть с одной зависимой и одной независимой переменной. Могли бы вы дать мне руководство или помочь с реализацией нейронной сети с одной зависимой и одной независимой переменной?
Data Science
Генерация искусственных данных для расширения обучающего набора
00
Вопрос или проблема У меня есть набор данных, содержащий 42 экземпляра (X) и одну финальную Y, на которой я хочу выполнить регрессию LASSO. Все они непрерывные и числовые. Поскольку размер выборки небольшой, я хочу его увеличить.
Data Science
Как подойти к отображению семейств векторов на решетке и прогнозированию результирующего значения
00
Вопрос или проблема Я описываю здесь модель, чтобы показать, как соседи влияют на узел. Я хочу реализовать её, чтобы попытаться прогнозировать значения, связанные с узлами; я публикую это здесь, чтобы попросить совета по математической модели и методам
Data Science
Модель SARIMAX для прогнозирования на следующие 100 дней.
00
Вопрос или проблема У меня есть ежедневные данные о погоде за почти 50 лет для одной погодной станции, и я хочу предсказать погоду на следующие 100 дней. Я использую Python, и все инструменты, которые я пробовал до сих пор (pmdarima.
Data Science
Каждый знает моделирование, основанное на данных, но что такое моделирование, основанное на модели (или не основанное на данных)?
00
Вопрос или проблема Существует множество моделей машинного обучения, основанных на данных. Легко назвать несколько из них: нейронные сети, линейная регрессия, SVM и так далее… но что такое моделирование, не основанное на данных (или модельное)
Data Science
Какую регрессионную модель мне выбрать?
00
Вопрос или проблема Мой исследовательский вопрос заключается в изучении влияния «получения внимания» от других участников в онлайн-сообществе на «устойчивое участие» на веб-сайте. Я решил измерить «устойчивое участие» каждого пользователя, вычислив среднее
Data Science
Алгоритм машинного обучения для прогнозирования числа случаев во время пандемии
00
Вопрос или проблема Я делаю свои первые шаги в ИИ и машинном обучении, поэтому столкнулся со следующей проблемой. Я пытаюсь предсказать результат по количеству дней с начала пандемии COVID-19 против подтвержденных случаев, используя библиотеку scikit-learn.
Data Science
Какой dtype будет уместен для данных о дате, когда они описываются как “дискретные”?
00
Вопрос или проблема Недавно я сдавал практический экзамен на получение квалификации Data Scientist Associate в DataCamp. Всего было 5 заданий, и я смог выполнить все, кроме одного. В этом задании требовалось очистить DataFrame для продаж домов.
Data Science
Программное обеспечение для пересчитанной минимизации L1?
00
Вопрос или проблема Я пытаюсь решить задачу оптимизации, способствующую разреженности. Хорошо известно, что L1-норма является хорошей заменой для L0-нормы, и в статье (Candes et al, 2008: Enhancing sparsity by reweighted L1 minimization https://arxiv.
Data Science
Проблема регрессии – слишком сложна для градиентного спуска.
00
Вопрос или проблема Я пытаюсь предсказать значения температур как функцию времени и различных параметров. Кривая температуры выглядит как “рампа” с некоторыми “гауссовыми пиками” на регулярных интервалах.
Data Science
Почему модель для набора данных может давать разные результаты среднеквадратичной ошибки?
00
Вопрос или проблема Я пытаюсь получить сертификат Data Scientist Associate от DataCamp. У меня возникла проблема с пробным экзаменом, предоставленным для практики перед Практическим Экзаменом. Я предоставил детали ниже. Буду очень признателен за вашу помощь.
Data Science
Ошибка выделения памяти в модели coxph
00
Вопрос или проблема Я работаю с моделями Кокса, и когда я добавляю больше переменных, я сталкиваюсь с проблемой памяти. Я пытался выделить подмножество моего датафрейма, выбрав столбцы с интересующими переменными, но даже тогда я сталкиваюсь с этой проблемой.
Data Science
Оценка регрессионных моделей с различными показателями (MSE, дисперсия, VAF и т.д.)
00
Вопрос или проблема При сравнении нескольких регрессионных моделей с точки зрения качества, кажется, что большинство согласны с MSE. Есть также статьи, сравнивающие “дисперсию” и “дисперсию, объясненную регрессией (VAF)”
Data Science
Существует ли какая-либо модель временных рядов, которая обрабатывает данные с переменной частотой?
00
Вопрос или проблема Цель: Предсказать желтые точки (желтые события появляются с разной частотой). Но мне сложно найти хорошую модель для этого случая. Большинство алгоритмов временных рядов работают с данными, имеющими одинаковую частоту (например, ежедневно/каждые 10 секунд).