svm
Data Science
Вопрос или проблема Я пытаюсь использовать методы кластеризации и классификации, такие как SVM, с использованием scikit-learn. Я также изучаю детекцию выбросов/новизны. Мне нужна что-то вроде полуподконтрольной модели. Я хочу предсказать некоторые метки
Data Science
Вопрос или проблема Я относительно новичок в дата-науке и у меня есть вопрос о NBSVM. У меня есть задача с двумя классами и текстовые данные (заголовки из газеты). Я хочу использовать NBSVM для прогнозирования, имеет ли заголовок метку 0 или 1.
Data Science
Вопрос или проблема Я обучаю SVM на Наборе данных о банковском маркетинге от UCI, файле bank additional-full.csv. Поскольку данные смещены, я также интересуюсь полнотой. Я получаю точность около 87.95%, но моя полнота составляет примерно 51%.
Data Science
Вопрос или проблема Привет, я хочу настроить/поискать гиперпараметры SVM в инструменте Orange. Как я могу это сделать? Я хочу применить исчерпывающий поиск по сетке к SVM http://scikit-learn.org/stable/modules/grid_search.html Дааааааааа, копаю золото
Data Science
Вопрос или проблема Я работаю над прогнозированием многомерного временного ряда, используя несколько алгоритмов машинного обучения (нейронные сети, метод опорных векторов и алгоритмы градиентного бустинга). Мне нужно измерить производительность каждой модели.
Data Science
Вопрос или проблема Я пытаюсь понять концепции в заголовке и как они соотносятся с задачей бинарной классификации. Согласно моему текущему пониманию, вы можете кодировать текст, используя различные методы извлечения признаков, такие как “
Data Science
Вопрос или проблема У меня есть набор данных о фильмах и их субтитрах. Моя задача – классифицировать их на основе их рейтингов – [R, NR, PG, PG-13, G]. У меня есть 13 примеров для каждого класса. Я предварительно обработал субтитры следующим
Data Science
Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные
Data Science
Вопрос или проблема Я исследую подход, при котором использую Maximum Mean Discrepancy (MMD) для измерения расстояния между двумя доменными наборами данных, а затем использую это расстояние для разделения признаков на два набора: общий и необычный признаки.
Data Science
Вопрос или проблема Документация говорит: Функция потерь, которая будет использоваться. По умолчанию – ‘hinge’, что дает линейный SVM. Функция потерь ‘log’ дает логистическую регрессию, вероятностный классификатор. ‘
Data Science
Вопрос или проблема Я пытаюсь классифицировать слова на основе сигналов ЭМГ, используя машину опорных векторов в качестве модели. Мой набор данных включает 15 классов (слов) с 230 повторами и 1000 признаками каждое. Я уже объединил все файлы вместе, чтобы упростить задачу.
Data Science
Вопрос или проблема Я занимаюсь моделированием прогнозирования ветра, используя модель SVR, и хотел бы сравнить фактические данные о скорости ветра и предсказанные данные. Я не уверен, что я сделал неправильно. Я предварительно обработал наборы данных и нормализовал их. >
Data Science
Вопрос или проблема Вопрос: Кто-нибудь знает о публично доступном пакете Python для крупномасштабных SVM? Спасибо! Почему на вопрос следует ответить: Как было отмечено (например, здесь), задача SVM может быть вычислительно затратной при большом объеме данных.
Data Science
Вопрос или проблема В SVM у нас есть 3 гиперплоскости, одна для разделения положительного и отрицательного классов Две другие лежат на опорных векторах. На рисунке – Уравнение гиперплоскостей, лежащих на опорных векторах, записывается как $w.
Data Science
Вопрос или проблема Я использовал 3 функции из scipy: TFIDF векторизатор, Мультивыходной классификатор и Линейный SVC. Код выглядит так. pipe_lr1 = Pipeline(steps=[('cv',TfidfVectorizer()), ('lr_multi',MultiOutputClassifier(LinearSVC()))]) Как я могу
Data Science
Вопрос или проблема Я работал над задачей идентификации именованных сущностей (а не распознавания). В этой задаче обработки естественного языка (NLP) модели дано предложение, и она должна предсказать, является ли каждое слово (или токен) именованной сущностью или нет.
Data Science
Вопрос или проблема Я задавался вопросом, почему мои модели (дерево решений, SVM, случайный лес) ведут себя таким образом, с “высокой” точностью на небольшом обучающем наборе данных. Это признак переобучения? График представляет собой точность
Data Science
Вопрос или проблема Я применил как SVM, так и CNN (используя Keras) на одном наборе данных. Теперь я хочу сравнить производительность обеих моделей. Функция Keras model.evaluate предсказывает выходные данные для данного ввода, а затем вычисляет заданную в model.
Data Science
Вопрос или проблема Мне нужно сгенерировать уравнение для гиперплоскости, у меня есть две независимые переменные и одна бинарная зависимая переменная. Что касается следующего уравнения для svm, $f(x)=sgn( sum_i alpha_i K(sv_i,x) + b )$ У меня есть две
Data Science
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.