naive-bayes-classifier - ответы на вопросы

Data Science

Почему в Naive Bayes вместо P(word|class), даже с предположениями о независимости и сглаживанием, не используется P(class|word)?

00

Вопрос или проблема Я пытаюсь понять, почему Наивный Байес использует $ P(\text{word}|\text{class})$ вместо $ P(\text{class}|\text{word})$ для классификации текста. Оба подхода кажутся математически обоснованными при предположении независимости, но я

Data Science

Отношение к майнингу текста и подготовке токенов, неуместным словам, низкая точность.

00

Вопрос или проблема Для целей довольно большого проекта я провожу текстовый анализ некоторых документов. Мои шаги довольно стандартны: Приведение всего к нижнему регистру Токенизация Стоп-лист и стоп-слова Лемматизация Стемминг Некоторые другие шаги

Data Science

Наивный Байес с использованием алгоритма максимизации ожидания vs логистическая регрессия для бинарной классификации

00

Вопрос или проблема Предположим, я имею дело с бинарной классификацией. Для какого типа данных использование Наивного Байеса с использованием метода максимального правдоподобия даст лучшее решение, а для какого типа данных логистическая регрессия будет лучшим выбором?

Data Science

Как правильно вычислить оценку спам-сообщения как комбинацию фиксированных признаков и вероятности из наивного байесовского классификатора?

00

Вопрос или проблема Я создаю классификатор спама/не спама для электронных писем в качестве задания. Он не должен быть хорошим общим классификатором, а должен уметь обучаться на небольшом наборе размеченных писем пользователя (примерно 650 –

Data Science

Как мне справиться с несбалансированными классами в задаче предсказания фондового рынка?

01

Вопрос или проблема Я работаю над моделью предсказания, чтобы определить, нужно ли продавать, удерживать или покупать акцию через n дней. Каждый день (или строка в наборе данных) я классифицирую, нужно ли продавать, удерживать или покупать, основываясь

Data Science

Классификация наивного байеса и машины опорных векторов (NBSVM)

00

Вопрос или проблема Я относительно новичок в дата-науке и у меня есть вопрос о NBSVM. У меня есть задача с двумя классами и текстовые данные (заголовки из газеты). Я хочу использовать NBSVM для прогнозирования, имеет ли заголовок метку 0 или 1.

Data Science

Реализация наивного байеса с использованием документации SkLearn

00

Вопрос или проблема Я изучаю метод классификации наивного Байеса из книги “Концепции и методы добычи данных” авторами Хан, Камбер, Пэй. Есть пример того, как узнать вероятность класса, используя классификатор наивного Байеса.

Data Science

Результат теста выше результата обучения

00

Вопрос или проблема Я реализовал классификатор наивного байесовского метода с гауссовским предположением, и у меня результат теста (99,99%) оказался выше, чем результат обучения (96,87%). Нормально это или это означает, что моя модель недостаточно обучена?

Data Science

Как рассчитать истинно положительные, истинно отрицательные, ложноположительные, ложноотрицательные и положительные с помощью классификатора Байеса с нуля.

00

Вопрос или проблема Я работаю над реализацией алгоритма классификации Наивного Байеса. У меня есть метод def prob_continous_value, который должен возвращать функцию плотности вероятности для атрибута, заданного классовым атрибутом.

Data Science

точность теста классификации текста слишком низкая

00

Вопрос или проблема У меня есть набор данных о фильмах и их субтитрах. Моя задача – классифицировать их на основе их рейтингов – [R, NR, PG, PG-13, G]. У меня есть 13 примеров для каждого класса. Я предварительно обработал субтитры следующим

Data Science

Вероятность гауссовского наивного байеса

00

Вопрос или проблема Как мне присвоить вероятность предсказанию, выведенному моделью гауссовского наивного байеса? Я спрашиваю, потому что функция predict_proba, которую вы можете использовать с классификатором гауссовского наивного байеса в sklearn, дает

Data Science

Оптимизируйте F-оценку только для определенных классов, игнорируя другие классы.

00

Вопрос или проблема У меня есть размеченный набор данных с обзорами продуктов, где метка — это оценка от 1 до 5, а обзор — просто текст. Я использую простой наивный байесовский классификатор (sklearn), чтобы попытаться предсказать оценку, учитывая обзор

Data Science

Анализ классификации текста на основе сходства

00

Вопрос или проблема Я прочитал много литературы по классификации текстов и различным подходам/моделям, особенно с использованием языка Python, но, вероятно, я все еще не понимаю, как построить модели и какие шаги для этого нужны.

Data Science

Когда регрессионные модели превосходят наивный метод?

00

Вопрос или проблема Период действия вознаграждения истекает через 7 дней. Ответы на этот вопрос имеют право на +150 репутационного вознаграждения. С. М. ищет канонический ответ. Случай 1: У меня есть следующая задача: Обучение на протяжении 3 последовательных

Data Science

Минимальное количество признаков для модели наивного Байеса

00

Вопрос или проблема Я продолжаю читать, что Наивный Байес требует меньше признаков, чем многие другие алгоритмы машинного обучения. Но каково минимальное количество признаков, которое вам на самом деле нужно, чтобы получить хорошие результаты (90% точности)

Data Science

ValueError: неверная форма ввода (111, 3)

00

Вопрос или проблема import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset = pd.read_csv('iris.csv') X = dataset.iloc[:,:4] y = dataset.iloc[:,4] from sklearn.preprocessing import OneHotEncoder encoder = OneHotEncoder(sparse=False) y=encoder.

Data Science

Наивный байесовский классификатор всегда предсказывает одну и ту же метку

00

Вопрос или проблема Я пытался написать классификатор наивного байеса с нуля, который должен предсказать класс метки набора данных nominal car.arff. Однако классификатор всегда предсказывает самый распространенный класс. Я попробовал логарифмические вероятности

Data Science

Как справиться с отсутствующими данными для наивного байесовского классификатора Бернулли?

00

Вопрос или проблема Я работаю с набором данных категориальных данных, который выглядит так: content_1 content_2 content_4 content_5 content_6 0 NaN 0.0 0.0 0.0 NaN 1 NaN 0.0 0.0 0.0 NaN 2 NaN NaN NaN NaN NaN 3 0.0 NaN 0.0 NaN 0.

Data Science

Плохая форма ввода — как интерпретировать и диагностировать; Также вопрос по машинному обучению.

00

Вопрос или проблема Извините, я новичок в машинном обучении, но я пытаюсь научиться. Я создаю классификатор на основе этого набора данных, чтобы предсказать психические расстройства на основе признаков. Я хотел запустить очень простую модель классификатора

Data Science

Наивный Байес предсказывает тип = ‘сырой’, возвращая NA

00

Вопрос или проблема Я создал модель наивного байеса для классификации текста. Она предсказывает правильно. Но она возвращает ‘NA’ в результатах предсказания, если я задаю ‘type = raw’. Я видел некоторые результаты на Stackoverflow о добавлении шума.