variance
Data Science
Вопрос или проблема Я пытаюсь понять некоторые методы инициализации весов, читая статью http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf. Но я не понимаю их обозначение дисперсии. Прямо в уравнении (5) они ссылаются на переменную $z^i$, и я не
Data Science
Вопрос или проблема Привет, я прослушиваю курс по распределению вероятностей в науке о данных, и ниже представлено вывод математического ожидания дисперсии Дисперсия = математическое ожидание квадратов отклонений от среднего для любого значения.
Data Science
Вопрос или проблема При сравнении нескольких регрессионных моделей с точки зрения качества, кажется, что большинство согласны с MSE. Есть также статьи, сравнивающие “дисперсию” и “дисперсию, объясненную регрессией (VAF)”
Data Science
Вопрос или проблема У меня есть набор данных, который содержит n признаков, масштабируемых в диапазоне [0,1]. Я хотел бы использовать алгоритм неуправляемого выбора признаков (пороговая дисперсия). Как я могу вычислить пороговое значение?
Data Science
Вопрос или проблема Известно, что итерация SGD имеет большую дисперсию. Учитывая обновление итерации: $$ w^{k+1} := w^k – \underbrace{\alpha \ g_i(w^k)}_{p^k}, $$ где $w$ – веса модели, а $g_i(w^k)$ – градиент функции потерь, оцененный для образца $i$.
Data Science
Вопрос или проблема Я задумывался, рассматривает ли кто-нибудь технику выборки, которая бы стремилась сохранить как можно больше дисперсии (например, как можно больше уникальных значений или очень широко распределенные непрерывные переменные).
Data Science
Вопрос или проблема У меня есть набор данных с 10 столбцами, которые являются моими признаками, и 1732 строками, которые представляют собой мои регистрации. Эти регистрации разделены на 15 классов, так что у меня есть несколько регистраций для каждого
Data Science
Вопрос или проблема Давайте скажем, что есть массив, содержащий числа с плавающей запятой, и его размер n. Теперь m чисел будут выбраны из этого массива, и сумма этих m чисел будет генерировать новое число. Таким образом, все возможные комбинации суммы
Data Science
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Вопрос или проблема Итак, я пытаюсь сравнить две модели, скажем, модель(1) имеет точность на обучении 90% и точность на валидации 86%, в то время как модель(2) имеет точность на обучении 87% и точность на валидации 85%. Теперь модель(1) имеет лучший результат
Вопросы и ответы
Вопрос или проблема Рассмотрим следующее: sealed trait IntTree case class Leaf(value: Int) extends IntTree case class Branch(left: IntTree, value: Int, right : IntTree) def test[A <: IntTree](x: A): A = { x match { case Leaf(v) =>
Data Science
Вопрос или проблема Я обучил модель GRU на некоторых данных и затем создал множество предсказаний на тестовом наборе. Предсказания действительно плохие, о чем свидетельствует почти нулевой коэффициент детерминации R2. Я замечаю, что дисперсия предсказаний
Data Science
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
Вопрос или проблема У меня есть две переменные в виде временных рядов, одна из которых является следствием другой. Я хотел бы найти среднюю временную задержку, которую требует зависимая переменная для реакции на независимую переменную.
Data Science
Вопрос или проблема Это вопрос для новичков. отредактировано 19/11. Я действительно запутался в термине дисперсия и во множестве других вариантов. Например, на рисунке ниже показана дисперсия двух моделей для сравнения. Являются ли общие термины (например
Data Science
Вопрос или проблема У меня есть два набора данных: один набор set1=[2,2,2,4.5] и другой набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, то set1 будет: set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому ожидал
Data Science
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Вопрос или проблема Основано на deeplearningbook: $$ \begin{align} MSE &= E[(\theta_m^{-} – \theta)^2] \\ &= Bias(\theta_m^{-})^2 + Var(\theta_m^{-})\\ \end{align} $$ где $m$ — это количество образцов в обучающем наборе, $\theta$ — это фактический