Data Science
Ограничение памяти для трюков с ядрами в машинном обучении
00
Вопрос или проблема Основываясь на лекции Эндрю Ына о ядрах, вы используете обучающие образцы (называемые ориентирами l) и используете их во время предсказания для построения представления данного образца в более высоком измерении.
Data Science
Многие разделяющие линии с использованием RBF ядра в SVM.
00
Вопрос или проблема Ниже приведен мой код, который берет диапазон чисел и создает новый столбец label, содержащий либо -1, либо 1. Если число больше 14000, мы маркируем его как -1 (выброс). Если число меньше 14000, мы маркируем его как 1 (нормальное значение).
Data Science
Версия перцептрона
00
Вопрос или проблема Если мы изменим условие $ywx<0$ (для выполнения обновления) на $ywx<1$, как в SVM (но без добавления регуляризации для максимизации отступа), будет ли какая-либо разница по сравнению с базовым персептроном (тот самый с вышеупомянутым условием $ywx<
Data Science
Как sklearn SVM находит начальную гиперплоскость перед оптимизацией?
00
Вопрос или проблема Цель оптимизации SVM — максимизировать расстояние между положительными и отрицательными гиперплоскостями. Но перед оптимизацией как sklearn сначала находит положительные и отрицательные опорные вектора, а значит, и гиперплоскости зазора?
Data Science
Как реализовать SVM с нуля?
00
Вопрос или проблема Я пытаюсь построить SVM с нуля и хотел бы максимизировать это выражение Лагранжа: Я знаю, что означают переменные, но хотел бы узнать, как реализуется эта максимизация. Должен ли я начать с альфа, близкого к 0, и увеличивать его, пока
Data Science
Данные для обучения в анализе настроений
00
Вопрос или проблема Я занимаюсь анализом настроений твитов, связанных с недавним приобретением Twitter Илоном Маском. У меня есть корпус из 10 000 твитов, и я хотел бы использовать методы машинного обучения с использованием таких моделей, как SVM и линейная регрессия.
Data Science
Как мне построить бинарный классификатор для тысяч положительных данных и миллионов размеченных данных?
00
Вопрос или проблема Пока что я наткнулся на много советов и статей о PU-обучении и унарной классификации. Короче говоря: есть ли у кого-нибудь предложения по конкретным алгоритмам или реализациям для размеченных данных только одного класса и разметки
Data Science
Неявный выбор признаков
00
Вопрос или проблема Я слышал, что метод случайного леса и другие деревянистые машины применяют какой-то вид неявного отбора признаков. Мой вопрос: относится ли это также к таким методам, как SVM? Насколько я понимаю, выбор опорных векторов также является
Data Science
GridSearchCV() для тонкой настройки выводов ValueError и FitFailedWarning
00
Вопрос или проблема Я хотел бы настроить некоторые параметры для моего линейного SVM. Вот код: class SVMSentiment(Base): “””Предсказывает оценки настроения с помощью линейной машины опорных векторов (SVM). Использует конвейер sklearn. “
Data Science
Почему не получается ожидаемый результат при использовании модели обучения SVM?
00
Вопрос или проблема Я хочу обучить модель для распознавания лицевых эмоций. Я использовал набор данных из 213 образцов. Сначала я извлекаю признаки с помощью фильтра Габора. Затем я уменьшаю размерность данных с помощью PCA и генетического алгоритма.
Data Science
Как мне справиться с несбалансированными классами в задаче предсказания фондового рынка?
00
Вопрос или проблема Я работаю над моделью предсказания, чтобы определить, нужно ли продавать, удерживать или покупать акцию через n дней. Каждый день (или строка в наборе данных) я классифицирую, нужно ли продавать, удерживать или покупать, основываясь
Data Science
Какова степень сходства между обучающими данными и данными о доходах?
00
Вопрос или проблема Я пытаюсь использовать методы кластеризации и классификации, такие как SVM, с использованием scikit-learn. Я также изучаю детекцию выбросов/новизны. Мне нужна что-то вроде полуподконтрольной модели. Я хочу предсказать некоторые метки
Data Science
Классификация наивного байеса и машины опорных векторов (NBSVM)
00
Вопрос или проблема Я относительно новичок в дата-науке и у меня есть вопрос о NBSVM. У меня есть задача с двумя классами и текстовые данные (заголовки из газеты). Я хочу использовать NBSVM для прогнозирования, имеет ли заголовок метку 0 или 1.
Data Science
Способы увеличения полноты в SVM
00
Вопрос или проблема Я обучаю SVM на Наборе данных о банковском маркетинге от UCI, файле bank additional-full.csv. Поскольку данные смещены, я также интересуюсь полнотой. Я получаю точность около 87.95%, но моя полнота составляет примерно 51%.
Data Science
Как настроить гиперпараметры оценщика в инструменте Orange
00
Вопрос или проблема Привет, я хочу настроить/поискать гиперпараметры SVM в инструменте Orange. Как я могу это сделать? Я хочу применить исчерпывающий поиск по сетке к SVM http://scikit-learn.org/stable/modules/grid_search.html Дааааааааа, копаю золото
Data Science
Подход скользящего окна с использованием SVR и LightGBM
00
Вопрос или проблема Я работаю над прогнозированием многомерного временного ряда, используя несколько алгоритмов машинного обучения (нейронные сети, метод опорных векторов и алгоритмы градиентного бустинга). Мне нужно измерить производительность каждой модели.
Data Science
Берт и классификация SVM
00
Вопрос или проблема Я пытаюсь понять концепции в заголовке и как они соотносятся с задачей бинарной классификации. Согласно моему текущему пониманию, вы можете кодировать текст, используя различные методы извлечения признаков, такие как “
Data Science
точность теста классификации текста слишком низкая
00
Вопрос или проблема У меня есть набор данных о фильмах и их субтитрах. Моя задача – классифицировать их на основе их рейтингов – [R, NR, PG, PG-13, G]. У меня есть 13 примеров для каждого класса. Я предварительно обработал субтитры следующим
Data Science
Классификация шумных данных
00
Вопрос или проблема Какой метод можно использовать для классификации данных в следующем примере? Есть таблица (сотни строк и сотни столбцов). Несколько столбцов в этой таблице уникально позволяют классифицировать каждую строку: Класс 0: …шумные биты…00…шумные
Data Science
Использование MMD для адаптации доменов (пространство RKHS) с GLM (оригинальное пространство)
00
Вопрос или проблема Я исследую подход, при котором использую Maximum Mean Discrepancy (MMD) для измерения расстояния между двумя доменными наборами данных, а затем использую это расстояние для разделения признаков на два набора: общий и необычный признаки.