Data Science
Проблема понимания прямого алгоритма для скрытых марковских моделей (HMM)
00
Вопрос или проблема Я нашел рекурсивную версию прямого алгоритма на Википедии, однако я не понимаю обозначения, использованные в псевдокоде: Что означает $$x_{t-1}$$ под знаком суммы? Что нужно суммировать? Было бы очень полезно, если бы кто-нибудь мог
Data Science
Каковы компромиссы между байесовским глубоким обучением и глубокими гауссовыми процессами?
00
Вопрос или проблема Я понимаю различия между глубокими гауссовыми процессами (DGPs) и байесовским глубинным обучением (BDL): DGPs по сути являются нейронными сетями прямого распространения, где каждый узел представляет собой гауссовый процесс, в то время
Data Science
Как обновить апостериорное убеждение, когда мы наблюдаем поток коррелированных данных из фиксированного, но неизвестного источника данных?
00
Вопрос или проблема Я хочу построить [вероятностную] модель, которая стремится вывести истинное значение неизвестной категориальной переменной, $y \in \{1,2,…, K\}$. У нас есть набор данных $(X,y): \mathbb{R}^d\rightarrow \{1,2,…
Data Science
Если я использую выборку Гиббса с байесовской моделью, что мне нужно проверить на отсутствие памяти?
00
Вопрос или проблема Прямо сейчас я пытаюсь лучше понять, как работает байесовское моделирование, начиная с основ. Я выяснил, читая учебники, что некоторые очень простые байесовские модели, такие как байесовское иерархическое моделирование, используют
Data Science
Является ли k-means с расстоянием Махаланобиса действительным вариантом для кластеризации?
00
Вопрос или проблема Я хочу получить больше информации о том, является ли k-means с расстоянием Махаланобиса математически/методологически корректным вариантом для наборов данных с различной дисперсией кластеров. Шаги следующие: Создайте агрегированные
Data Science
Объедините вероятность предварительных знаний с вероятностными результатами модели машинного обучения.
00
Вопрос или проблема Я хочу объединить предыдущие знания, чтобы улучшить свою модель машинного обучения. В соответствии с правилом Байеса максимальная апостериорная вероятность получается, когда мы умножаем апрiori на MLE. Я умножаю априорную вероятность
Data Science
Вероятность для N-го места в гонке на основе модели Бредли-Терри: входные и выходные данные.
00
Вопрос или проблема Я создал модель прогнозирования гонок на мотоциклах, которая принимает пары гонщиков и выводит вероятность того, что каждый гонщик обгонит другого в каждом парном сравнении. Эта информация затем обрабатывается с использованием модели
Data Science
Постериорные оценки гиперпараметров
00
Вопрос или проблема Если среднее значение априорного распределения параметра не фиксировано, а оценивается, неправильно ли говорить о максимальной апостериорной оценке априорного среднего? Ответ или решение Вопрос о том, правильно ли называть максимальную
Data Science
Обновление среднего значения и дисперсии весов
00
Вопрос или проблема Я пытаюсь понять алгоритм Байес по обратному распространению из статьи Неопределенность весов в нейронных сетях, идея заключается в том, чтобы создать нейронную сеть, в которой каждый вес имеет собственное распределение вероятностей.
Data Science
Каково правильное значение и интерпретация p-значений?
00
Вопрос или проблема Я публикую этот вопрос, и ответ, чтобы помочь развеять некоторые недоразумения о том, что такое p-значения. Как менеджер по найму, проводящий собеседования с Data Scientist-ами среднего и старшего уровня, я неоднократно сталкивался с этими недоразумениями.
Data Science
Сочетание нескольких вероятностей от классификатора. Пропагирование вероятностей.
00
Вопрос или проблема Допустим, я обучил классификатор, который классифицирует изображения животных на 10 разных классов. И предположим, что у меня есть 20 различных изображений конкретного животного, и поскольку я знаю фотографа, я с уверенностью знаю
Data Science
Переменный множитель для предельной правдоподобности
00
Вопрос или проблема В знаменитой статье Оценка масштабируемого предельного правдоподобия для выбора модели в глубокое обучение Иммер и др. Иммер использует приближенную лапласовскую оценку для оценки предельного логарифмического правдоподобия, которое
Вопросы и ответы
Свертка двух ЭКДФ в R
00
Вопрос или проблема Я хочу применить некоторые байесовские методы к эмпирической функции накопленной плотности, которую генерирует мой код на R: rr<-ecdf(answers) Так что, если я сгенерирую предварительную ЭКП (назовем ее ‘
Data Science
Модель Пуассона с переизбыточностью
00
Вопрос или проблема Я работаю с набором данных $X$ (длиной $N$) счетных данных, который выглядит следующим образом: Я разработал статистическую модель, которую можно улучшить, поэтому я прошу любые предложения, например, разные вероятности или выбор приоритета
Data Science
Существует ли модель, которая может предсказывать непрерывные данные, одновременно предоставляя уровень доверия к прогнозу?
00
Вопрос или проблема Проблема с байесовской нейронной сетью, похоже, заключается в том, что она в основном работает для задач классификации. Возможно ли адаптировать эту нейронную сеть или даже использовать другую модель, если таковая существует, для прогнозирования
Data Science
Как Naive Bayes делает предсказания на основе scikit-learn?
00
Вопрос или проблема Мне нужно понять, как алгоритм многомерного наивного байеса может делать предсказания на основе реализации в scikit-learn. Я увидел исходный код, но хочу понять математику, стоящую за этим. Не могли бы вы объяснить математику этого предсказания?
Data Science
Пользовательская регуляризация для логистической регрессии
00
Вопрос или проблема Мое понимание l2 регуляризации: Весы модели считаются имеющими априорное гауссово распределение, центрированное вокруг 0. Затем оценка MAP по данным добавляет дополнительное наказание в функцию стоимости. Мое сформулированное заявление