naive-bayes-classifier
Data Science
Вопрос или проблема Предположим, я имею дело с бинарной классификацией. Для какого типа данных использование Наивного Байеса с использованием метода максимального правдоподобия даст лучшее решение, а для какого типа данных логистическая регрессия будет лучшим выбором?
Data Science
Вопрос или проблема Я создаю классификатор спама/не спама для электронных писем в качестве задания. Он не должен быть хорошим общим классификатором, а должен уметь обучаться на небольшом наборе размеченных писем пользователя (примерно 650 –
Data Science
Вопрос или проблема Я работаю над моделью предсказания, чтобы определить, нужно ли продавать, удерживать или покупать акцию через n дней. Каждый день (или строка в наборе данных) я классифицирую, нужно ли продавать, удерживать или покупать, основываясь
Data Science
Вопрос или проблема Я относительно новичок в дата-науке и у меня есть вопрос о NBSVM. У меня есть задача с двумя классами и текстовые данные (заголовки из газеты). Я хочу использовать NBSVM для прогнозирования, имеет ли заголовок метку 0 или 1.
Data Science
Вопрос или проблема Я изучаю метод классификации наивного Байеса из книги “Концепции и методы добычи данных” авторами Хан, Камбер, Пэй. Есть пример того, как узнать вероятность класса, используя классификатор наивного Байеса.
Data Science
Вопрос или проблема Я реализовал классификатор наивного байесовского метода с гауссовским предположением, и у меня результат теста (99,99%) оказался выше, чем результат обучения (96,87%). Нормально это или это означает, что моя модель недостаточно обучена?
Data Science
Вопрос или проблема Я работаю над реализацией алгоритма классификации Наивного Байеса. У меня есть метод def prob_continous_value, который должен возвращать функцию плотности вероятности для атрибута, заданного классовым атрибутом.
Data Science
Вопрос или проблема У меня есть набор данных о фильмах и их субтитрах. Моя задача – классифицировать их на основе их рейтингов – [R, NR, PG, PG-13, G]. У меня есть 13 примеров для каждого класса. Я предварительно обработал субтитры следующим
Data Science
Вопрос или проблема Как мне присвоить вероятность предсказанию, выведенному моделью гауссовского наивного байеса? Я спрашиваю, потому что функция predict_proba, которую вы можете использовать с классификатором гауссовского наивного байеса в sklearn, дает
Data Science
Вопрос или проблема У меня есть размеченный набор данных с обзорами продуктов, где метка — это оценка от 1 до 5, а обзор — просто текст. Я использую простой наивный байесовский классификатор (sklearn), чтобы попытаться предсказать оценку, учитывая обзор
Data Science
Вопрос или проблема Я прочитал много литературы по классификации текстов и различным подходам/моделям, особенно с использованием языка Python, но, вероятно, я все еще не понимаю, как построить модели и какие шаги для этого нужны.
Data Science
Вопрос или проблема Период действия вознаграждения истекает через 7 дней. Ответы на этот вопрос имеют право на +150 репутационного вознаграждения. С. М. ищет канонический ответ. Случай 1: У меня есть следующая задача: Обучение на протяжении 3 последовательных
Data Science
Вопрос или проблема Я продолжаю читать, что Наивный Байес требует меньше признаков, чем многие другие алгоритмы машинного обучения. Но каково минимальное количество признаков, которое вам на самом деле нужно, чтобы получить хорошие результаты (90% точности)
Data Science
Вопрос или проблема import numpy as np import matplotlib.pyplot as plt import pandas as pd dataset = pd.read_csv('iris.csv') X = dataset.iloc[:,:4] y = dataset.iloc[:,4] from sklearn.preprocessing import OneHotEncoder encoder = OneHotEncoder(sparse=False) y=encoder.
Data Science
Вопрос или проблема Я пытался написать классификатор наивного байеса с нуля, который должен предсказать класс метки набора данных nominal car.arff. Однако классификатор всегда предсказывает самый распространенный класс. Я попробовал логарифмические вероятности
Data Science
Вопрос или проблема Я работаю с набором данных категориальных данных, который выглядит так: content_1 content_2 content_4 content_5 content_6 0 NaN 0.0 0.0 0.0 NaN 1 NaN 0.0 0.0 0.0 NaN 2 NaN NaN NaN NaN NaN 3 0.0 NaN 0.0 NaN 0.
Data Science
Вопрос или проблема Извините, я новичок в машинном обучении, но я пытаюсь научиться. Я создаю классификатор на основе этого набора данных, чтобы предсказать психические расстройства на основе признаков. Я хотел запустить очень простую модель классификатора
Data Science
Вопрос или проблема Я создал модель наивного байеса для классификации текста. Она предсказывает правильно. Но она возвращает ‘NA’ в результатах предсказания, если я задаю ‘type = raw’. Я видел некоторые результаты на Stackoverflow о добавлении шума.
Data Science
Вопрос или проблема В библиотеке Sklearn существует несколько типов алгоритмов Наивного Байеса: Можно ли использовать все из них для классификации текста? И какой из них работает лучше? Я протестировал простую классификацию текста с использованием мультипликативного