variance
Data Science
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Вопрос или проблема Итак, я пытаюсь сравнить две модели, скажем, модель(1) имеет точность на обучении 90% и точность на валидации 86%, в то время как модель(2) имеет точность на обучении 87% и точность на валидации 85%. Теперь модель(1) имеет лучший результат
Вопросы и ответы
Вопрос или проблема Рассмотрим следующее: sealed trait IntTree case class Leaf(value: Int) extends IntTree case class Branch(left: IntTree, value: Int, right : IntTree) def test[A <: IntTree](x: A): A = { x match { case Leaf(v) =>
Data Science
Вопрос или проблема Я обучил модель GRU на некоторых данных и затем создал множество предсказаний на тестовом наборе. Предсказания действительно плохие, о чем свидетельствует почти нулевой коэффициент детерминации R2. Я замечаю, что дисперсия предсказаний
Data Science
Вопрос или проблема У меня есть два набора данных: первый набор set1=[2,2,2,4.5], а второй набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, для set1 получится: для set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому
Data Science
Вопрос или проблема У меня есть две переменные в виде временных рядов, одна из которых является следствием другой. Я хотел бы найти среднюю временную задержку, которую требует зависимая переменная для реакции на независимую переменную.
Data Science
Вопрос или проблема Это вопрос для новичков. отредактировано 19/11. Я действительно запутался в термине дисперсия и во множестве других вариантов. Например, на рисунке ниже показана дисперсия двух моделей для сравнения. Являются ли общие термины (например
Data Science
Вопрос или проблема У меня есть два набора данных: один набор set1=[2,2,2,4.5] и другой набор set2=[2,1.5,2,4.5,2.5]. Если я построю их распределения, то set1 будет: set2 будет: Я бы сказал, что set2 имеет более широкое распределение, и поэтому ожидал
Data Science
Вопрос или проблема Предположим, что у нас есть гипотетический набор данных {S} с 100 переменными признаков X и 10 предсказанными переменными Y. X1 … X100 Y1 …. Y10 1 .. 2 3 .. 4 4 .. 3 2 .. 1 Предположим, я хочу повысить точность Y1.
Data Science
Вопрос или проблема Основано на deeplearningbook: $$ \begin{align} MSE &= E[(\theta_m^{-} – \theta)^2] \\ &= Bias(\theta_m^{-})^2 + Var(\theta_m^{-})\\ \end{align} $$ где $m$ — это количество образцов в обучающем наборе, $\theta$ — это фактический