Data Science
Методы инициализации и дисперсия
00
Вопрос или проблема Я пытаюсь понять некоторые методы инициализации весов, читая статью http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf. Но я не понимаю их обозначение дисперсии. Прямо в уравнении (5) они ссылаются на переменную $z^i$, и я не
Data Science
Вывод математического ожидания для дисперсии.
00
Вопрос или проблема Привет, я прослушиваю курс по распределению вероятностей в науке о данных, и ниже представлено вывод математического ожидания дисперсии Дисперсия = математическое ожидание квадратов отклонений от среднего для любого значения.
Data Science
Оценка регрессионных моделей с различными показателями (MSE, дисперсия, VAF и т.д.)
00
Вопрос или проблема При сравнении нескольких регрессионных моделей с точки зрения качества, кажется, что большинство согласны с MSE. Есть также статьи, сравнивающие “дисперсию” и “дисперсию, объясненную регрессией (VAF)”
Data Science
Как я могу вычислить идеальное пороговое значение дисперсии для моих данных?
00
Вопрос или проблема У меня есть набор данных, который содержит n признаков, масштабируемых в диапазоне [0,1]. Я хотел бы использовать алгоритм неуправляемого выбора признаков (пороговая дисперсия). Как я могу вычислить пороговое значение?
Data Science
Вычисление дисперсии итерации SGD
00
Вопрос или проблема Известно, что итерация SGD имеет большую дисперсию. Учитывая обновление итерации: $$ w^{k+1} := w^k – \underbrace{\alpha \ g_i(w^k)}_{p^k}, $$ где $w$ – веса модели, а $g_i(w^k)$ – градиент функции потерь, оцененный для образца $i$.
Data Science
Отбор, пытаясь сохранить как можно больше многомерной дисперсии.
00
Вопрос или проблема Я задумывался, рассматривает ли кто-нибудь технику выборки, которая бы стремилась сохранить как можно больше дисперсии (например, как можно больше уникальных значений или очень широко распределенные непрерывные переменные).
Data Science
Как определить признаки, которые приносят больше варьирования?
00
Вопрос или проблема У меня есть набор данных с 10 столбцами, которые являются моими признаками, и 1732 строками, которые представляют собой мои регистрации. Эти регистрации разделены на 15 классов, так что у меня есть несколько регистраций для каждого
Data Science
Вычислите среднее/дисперсию сумм случайно выбранных чисел из массива.
00
Вопрос или проблема Давайте скажем, что есть массив, содержащий числа с плавающей запятой, и его размер n. Теперь m чисел будут выбраны из этого массива, и сумма этих m чисел будет генерировать новое число. Таким образом, все возможные комбинации суммы
Data Science
Согласование многопиковых гистограмм
00
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Низкая дисперсия против высоких валидационных оценок
00
Вопрос или проблема Итак, я пытаюсь сравнить две модели, скажем, модель(1) имеет точность на обучении 90% и точность на валидации 86%, в то время как модель(2) имеет точность на обучении 87% и точность на валидации 85%. Теперь модель(1) имеет лучший результат
Вопросы и ответы
Функция Scala принимает и возвращает тот же тип верхней границы.
00
Вопрос или проблема Рассмотрим следующее: sealed trait IntTree case class Leaf(value: Int) extends IntTree case class Branch(left: IntTree, value: Int, right : IntTree) def test[A <: IntTree](x: A): A = { x match { case Leaf(v) =>
Data Science
Почему дисперсия моих предсказаний модели значительно меньше, чем у обучающих данных?
00
Вопрос или проблема Я обучил модель GRU на некоторых данных и затем создал множество предсказаний на тестовом наборе. Предсказания действительно плохие, о чем свидетельствует почти нулевой коэффициент детерминации R2. Я замечаю, что дисперсия предсказаний
Data Science
Является ли дисперсия пропорциональной максимальному расстоянию между образцами распределения?
00
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
Как найти среднее время задержки с дисперсией и доверительным интервалом для двух временных рядов
00
Вопрос или проблема У меня есть две переменные в виде временных рядов, одна из которых является следствием другой. Я хотел бы найти среднюю временную задержку, которую требует зависимая переменная для реакции на независимую переменную.
Data Science
дисперсия, объясненная моделью
00
Вопрос или проблема Это вопрос для новичков. отредактировано 19/11. Я действительно запутался в термине дисперсия и во множестве других вариантов. Например, на рисунке ниже показана дисперсия двух моделей для сравнения. Являются ли общие термины (например
Data Science
Что такое дисперсия распределения?
00
Вопрос или проблема У меня есть два набора данных: один набор set1=[2,2,2,4.5] и другой набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, то set1 будет: set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому ожидал
Data Science
Учитывая модель регрессии с множеством переменных признаков, какие инструменты вы бы использовали, чтобы определить, какие переменные признаков добавляют наибольшую дисперсию?
00
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Математика за этим, $MSE = смещение^2 + дисперсия$
00
Вопрос или проблема Основано на deeplearningbook: $$ \begin{align} MSE &= E[(\theta_m^{-} – \theta)^2] \\ &= Bias(\theta_m^{-})^2 + Var(\theta_m^{-})\\ \end{align} $$ где $m$ — это количество образцов в обучающем наборе, $\theta$ — это фактический