Data Science
Является ли максимальная BDeu Байесовская сеть всегда пустой сетью?
00
Вопрос или проблема Я недавно читаю статью о Механизмах оценки для байесовских сетей. Для оценки BDeu оказывается, что максимальный возможный балл BDeu для структуры обучения байесовской сети равен нулю. Значит ли это, что лучшая сеть — это всегда пустая сеть?
Data Science
TF-IDF для ранжирования документов
00
Вопрос или проблема Я работаю над ранжированием некоторых заголовков новостей (однаковая тема) в зависимости от того, сколько информации в них содержится. Я вычислил tf-idf значения для каждого слова в каждом документе в своем корпусе.
Data Science
Рейтинг банкоматов на основе использования и экономических данных (Модель оценки/рейтинга)
00
Вопрос или проблема У меня есть образец данных о расположении около 10 банкоматов, а также их количестве использования (внесения наличных, снятия наличных и других операций) за последние 3 месяца. Я планирую собрать дополнительные данные, такие как ближайшие
Data Science
Какой “двоичный выбор” существует в BM25?
00
Вопрос или проблема Я читал Главу 14 Ответы на вопросы, Поиск информации и RAG книги Юрафски, конкретно раздел о оценке документов, где упоминался Okapi BM25. Я понял предыдущее вычисление и объяснение tf-idf, но не понимаю эту фразу, выделенную магентовым цветом. …
Data Science
Как правильно группировать переменные для расчета WoE при кредитном scoring?
00
Вопрос или проблема Я прочитал эту статью о разработке кредитной оценочной карты на python, где говорится, что при группировке непрерывных переменных необходимо убедиться, что: 1. Каждая группа должна содержать не менее 5% наблюдений 2.
Data Science
Представление строго правильного оценочного правила для многоклассовой классификации
00
Вопрос или проблема Я работаю над задачей классификации, используя признаки $\mathbf{x}$ для предсказания целевой переменной $y \in \mathbb{N}_0$. Под строгим правильным правилом оценивания я имею в виду функцию потерь $\ell(y,\hat{y})$, для которой