variance - ответы на вопросы

Data Science

Поиск финтех-датасетов для исследования по снижению дисперсии в A/B-тестировании.

00

Вопрос или проблема Я студент четвертого курса Прикладной математики, в данный момент пишу дипломную работу о снижении дисперсии в онлайн-экспериментах. Моя цель — применить различные методы снижения дисперсии (например, стратификация, CUPED) в контексте A/B тестирования.

Data Science

Методы инициализации и дисперсия

00

Вопрос или проблема Я пытаюсь понять некоторые методы инициализации весов, читая статью http://proceedings.mlr.press/v9/glorot10a/glorot10a.pdf. Но я не понимаю их обозначение дисперсии. Прямо в уравнении (5) они ссылаются на переменную $z^i$, и я не

Data Science

Вывод математического ожидания для дисперсии.

00

Вопрос или проблема Привет, я прослушиваю курс по распределению вероятностей в науке о данных, и ниже представлено вывод математического ожидания дисперсии Дисперсия = математическое ожидание квадратов отклонений от среднего для любого значения.

Data Science

Оценка регрессионных моделей с различными показателями (MSE, дисперсия, VAF и т.д.)

00

Вопрос или проблема При сравнении нескольких регрессионных моделей с точки зрения качества, кажется, что большинство согласны с MSE. Есть также статьи, сравнивающие “дисперсию” и “дисперсию, объясненную регрессией (VAF)”

Data Science

Как я могу вычислить идеальное пороговое значение дисперсии для моих данных?

00

Вопрос или проблема У меня есть набор данных, который содержит n признаков, масштабируемых в диапазоне [0,1]. Я хотел бы использовать алгоритм неуправляемого выбора признаков (пороговая дисперсия). Как я могу вычислить пороговое значение?

Data Science

Вычисление дисперсии итерации SGD

00

Вопрос или проблема Известно, что итерация SGD имеет большую дисперсию. Учитывая обновление итерации: $$ w^{k+1} := w^k – \underbrace{\alpha \ g_i(w^k)}_{p^k}, $$ где $w$ – веса модели, а $g_i(w^k)$ – градиент функции потерь, оцененный для образца $i$.

Data Science

Отбор, пытаясь сохранить как можно больше многомерной дисперсии.

00

Вопрос или проблема Я задумывался, рассматривает ли кто-нибудь технику выборки, которая бы стремилась сохранить как можно больше дисперсии (например, как можно больше уникальных значений или очень широко распределенные непрерывные переменные).

Data Science

Как определить признаки, которые приносят больше варьирования?

00

Вопрос или проблема У меня есть набор данных с 10 столбцами, которые являются моими признаками, и 1732 строками, которые представляют собой мои регистрации. Эти регистрации разделены на 15 классов, так что у меня есть несколько регистраций для каждого

Data Science

Вычислите среднее/дисперсию сумм случайно выбранных чисел из массива.

00

Вопрос или проблема Давайте скажем, что есть массив, содержащий числа с плавающей запятой, и его размер n. Теперь m чисел будут выбраны из этого массива, и сумма этих m чисел будет генерировать новое число. Таким образом, все возможные комбинации суммы

Data Science

Согласование многопиковых гистограмм

00

Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .

Data Science

Низкая дисперсия против высоких валидационных оценок

00

Вопрос или проблема Итак, я пытаюсь сравнить две модели, скажем, модель(1) имеет точность на обучении 90% и точность на валидации 86%, в то время как модель(2) имеет точность на обучении 87% и точность на валидации 85%. Теперь модель(1) имеет лучший результат

Вопросы и ответы

Функция Scala принимает и возвращает тот же тип верхней границы.

00

Вопрос или проблема Рассмотрим следующее: sealed trait IntTree case class Leaf(value: Int) extends IntTree case class Branch(left: IntTree, value: Int, right : IntTree) def test[A <: IntTree](x: A): A = { x match { case Leaf(v) =>

Data Science

Почему дисперсия моих предсказаний модели значительно меньше, чем у обучающих данных?

00

Вопрос или проблема Я обучил модель GRU на некоторых данных и затем создал множество предсказаний на тестовом наборе. Предсказания действительно плохие, о чем свидетельствует почти нулевой коэффициент детерминации R2. Я замечаю, что дисперсия предсказаний

Data Science

Является ли дисперсия пропорциональной максимальному расстоянию между образцами распределения?

00

Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому

Data Science

Как найти среднее время задержки с дисперсией и доверительным интервалом для двух временных рядов

00

Вопрос или проблема У меня есть две переменные в виде временных рядов, одна из которых является следствием другой. Я хотел бы найти среднюю временную задержку, которую требует зависимая переменная для реакции на независимую переменную.

Data Science

дисперсия, объясненная моделью

00

Вопрос или проблема Это вопрос для новичков. отредактировано 19/11. Я действительно запутался в термине дисперсия и во множестве других вариантов. Например, на рисунке ниже показана дисперсия двух моделей для сравнения. Являются ли общие термины (например

Data Science

Что такое дисперсия распределения?

00

Вопрос или проблема У меня есть два набора данных: один набор set1=[2,2,2,4.5] и другой набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, то set1 будет: set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому ожидал

Data Science

Учитывая модель регрессии с множеством переменных признаков, какие инструменты вы бы использовали, чтобы определить, какие переменные признаков добавляют наибольшую дисперсию?

00

Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.

Data Science

Математика за этим, $MSE = смещение^2 + дисперсия$

00

Вопрос или проблема Основано на deeplearningbook: $$ \begin{align} MSE &= E[(\theta_m^{-} – \theta)^2] \\ &= Bias(\theta_m^{-})^2 + Var(\theta_m^{-})\\ \end{align} $$ где $m$ — это количество образцов в обучающем наборе, $\theta$ — это фактический