svm - ответы на вопросы - Page 2 of 3

Data Science

Какова степень сходства между обучающими данными и данными о доходах?

00

Вопрос или проблема Я пытаюсь использовать методы кластеризации и классификации, такие как SVM, с использованием scikit-learn. Я также изучаю детекцию выбросов/новизны. Мне нужна что-то вроде полуподконтрольной модели. Я хочу предсказать некоторые метки

Data Science

Классификация наивного байеса и машины опорных векторов (NBSVM)

00

Вопрос или проблема Я относительно новичок в дата-науке и у меня есть вопрос о NBSVM. У меня есть задача с двумя классами и текстовые данные (заголовки из газеты). Я хочу использовать NBSVM для прогнозирования, имеет ли заголовок метку 0 или 1.

Data Science

Способы увеличения полноты в SVM

00

Вопрос или проблема Я обучаю SVM на Наборе данных о банковском маркетинге от UCI, файле bank additional-full.csv. Поскольку данные смещены, я также интересуюсь полнотой. Я получаю точность около 87.95%, но моя полнота составляет примерно 51%.

Data Science

Как настроить гиперпараметры оценщика в инструменте Orange

00

Вопрос или проблема Привет, я хочу настроить/поискать гиперпараметры SVM в инструменте Orange. Как я могу это сделать? Я хочу применить исчерпывающий поиск по сетке к SVM http://scikit-learn.org/stable/modules/grid_search.html Дааааааааа, копаю золото

Data Science

Подход скользящего окна с использованием SVR и LightGBM

00

Вопрос или проблема Я работаю над прогнозированием многомерного временного ряда, используя несколько алгоритмов машинного обучения (нейронные сети, метод опорных векторов и алгоритмы градиентного бустинга). Мне нужно измерить производительность каждой модели.

Data Science

Берт и классификация SVM

00

Вопрос или проблема Я пытаюсь понять концепции в заголовке и как они соотносятся с задачей бинарной классификации. Согласно моему текущему пониманию, вы можете кодировать текст, используя различные методы извлечения признаков, такие как “

Data Science

точность теста классификации текста слишком низкая

00

Вопрос или проблема У меня есть набор данных о фильмах и их субтитрах. Моя задача – классифицировать их на основе их рейтингов – [R, NR, PG, PG-13, G]. У меня есть 13 примеров для каждого класса. Я предварительно обработал субтитры следующим

Data Science

Классификация шумных данных

00

Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные

Data Science

Использование MMD для адаптации доменов (пространство RKHS) с GLM (оригинальное пространство)

00

Вопрос или проблема Я исследую подход, при котором использую Maximum Mean Discrepancy (MMD) для измерения расстояния между двумя доменными наборами данных, а затем использую это расстояние для разделения признаков на два набора: общий и необычный признаки.

Data Science

Какой алгоритм используется в sklearn SGDClassifier, когда используется модифицированная потеря Хубера?

00

Вопрос или проблема Документация говорит: Функция потерь, которая будет использоваться. По умолчанию – ‘hinge’, что дает линейный SVM. Функция потерь ‘log’ дает логистическую регрессию, вероятностный классификатор. ‘

Data Science

Как правильно использовать вейвлет-преобразование для извлечения признаков?

01

Вопрос или проблема Я пытаюсь классифицировать слова на основе сигналов ЭМГ, используя машину опорных векторов в качестве модели. Мой набор данных включает 15 классов (слов) с 230 повторами и 1000 признаками каждое. Я уже объединил все файлы вместе, чтобы упростить задачу.

Data Science

Правильно ли работает моя модель SVR?

00

Вопрос или проблема Я занимаюсь моделированием прогнозирования ветра, используя модель SVR, и хотел бы сравнить фактические данные о скорости ветра и предсказанные данные. Я не уверен, что я сделал неправильно. Я предварительно обработал наборы данных и нормализовал их. >

Data Science

Существует ли открытая реализация крупномасштабной SVM?

00

Вопрос или проблема Вопрос: Кто-нибудь знает о публично доступном пакете Python для крупномасштабных SVM? Спасибо! Почему на вопрос следует ответить: Как было отмечено (например, здесь), задача SVM может быть вычислительно затратной при большом объеме данных.

Data Science

Почему мы принимаем +1 и -1 для гиперплоскости опорного вектора в SVM?

00

Вопрос или проблема В SVM у нас есть 3 гиперплоскости, одна для разделения положительного и отрицательного классов Две другие лежат на опорных векторах. На рисунке – Уравнение гиперплоскостей, лежащих на опорных векторах, записывается как $w.

Data Science

Как я могу распечатать данные после подгонки данных в конвейере?

00

Вопрос или проблема Я использовал 3 функции из scipy: TFIDF векторизатор, Мультивыходной классификатор и Линейный SVC. Код выглядит так. pipe_lr1 = Pipeline(steps=[('cv',TfidfVectorizer()), ('lr_multi',MultiOutputClassifier(LinearSVC()))]) Как я могу

Data Science

Как мне разработать функции для задачи идентификации именованных сущностей?

00

Вопрос или проблема Я работал над задачей идентификации именованных сущностей (а не распознавания). В этой задаче обработки естественного языка (NLP) модели дано предложение, и она должна предсказать, является ли каждое слово (или токен) именованной сущностью или нет.

Data Science

Почему мои модели имеют довольно высокую точность с небольшим обучающим набором данных?

00

Вопрос или проблема Я задавался вопросом, почему мои модели (дерево решений, SVM, случайный лес) ведут себя таким образом, с “высокой” точностью на небольшом обучающем наборе данных. Это признак переобучения? График представляет собой точность

Data Science

Как сравнить производительность моделей SVM и Keras

00

Вопрос или проблема Я применил как SVM, так и CNN (используя Keras) на одном наборе данных. Теперь я хочу сравнить производительность обеих моделей. Функция Keras model.evaluate предсказывает выходные данные для данного ввода, а затем вычисляет заданную в model.

Data Science

Уравнение гиперплоскости для радиальной основы SVM.

00

Вопрос или проблема Мне нужно сгенерировать уравнение для гиперплоскости, у меня есть две независимые переменные и одна бинарная зависимая переменная. Что касается следующего уравнения для svm, $f(x)=sgn( sum_i alpha_i K(sv_i,x) + b )$ У меня есть две

Data Science

Почему у SVM хуже граница разделения, чем у логистической регрессии?

00

Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.