Data Science
Почему потери MSE и кросс-энтропии имеют одинаковый градиент?
00
Вопрос или проблема Я студент по специальности анализ данных, и когда я учился выводить функцию потерь логистической регрессии (потери кросс-энтропии), я обнаружил, что градиент совершенно идентичен градиенту методом наименьших квадратов для линейной
Data Science
Что вызывает взрывы в MSE при обучении?
00
Вопрос или проблема Я, вероятно, сильно переобучил модель. Но мне было просто любопытно, что может вызвать такое поведение. Я продолжал обучение (Эпоха 1/50 не первая эпоха обучения этой модели). Вы можете видеть, что среднеквадратичная ошибка (потери) очень низкая.
Data Science
Поиск вектора, который минимизирует среднеквадратичную ошибку его линейной комбинации
00
Вопрос или проблема Я работал над проектом, связанным с COVID-19. Вот вопрос: N = вектор новых ежедневно выявленных случаев заражения D = вектор ежедневных смертей E[D] = оценка ежедневных смертей N — это n-мерный вектор, n составляет около 60.
Data Science
Сравнение между регрессионной моделью
00
Вопрос или проблема У меня есть одна папка, в которой содержится много файлов CSV, размеры которых составляют 24×25. Каждый файл CSV представляет собой данные за один день. Я выполняю следующую задачу: Случай 1: Рассмотрим следующий наивный классификатор
Data Science
Когда низкий коэффициент детерминации может создать хорошие предсказательные модели?
00
Вопрос или проблема Большинство обсуждений по поводу предсказаний моделей утверждает, что следует сосредоточиться на метриках ошибки, таких как RMSE, MSE, MAE или MAPE. Некоторые даже утверждают, что r-квадрат может быть низким в хорошей модели.
Data Science
Математика за этим, $MSE = смещение^2 + дисперсия$
00
Вопрос или проблема Основано на deeplearningbook: $$ \begin{align} MSE &= E[(\theta_m^{-} – \theta)^2] \\ &= Bias(\theta_m^{-})^2 + Var(\theta_m^{-})\\ \end{align} $$ где $m$ — это количество образцов в обучающем наборе, $\theta$ — это фактический