classification
Data Science
Вопрос или проблема Я работаю над проектом по классификации. У меня есть много строк, содержащих множество бинарных атрибутов, некоторые из которых часто встречаются вместе, точно так же, как это можно встретить в проблеме рыночной корзины (когда, например
Data Science
Вопрос или проблема Большинство вопросов о дисбалансе данных на этом сайте касаются того, как обучить лучшую модель, но я склонен считать, что другая проблема заключается в том, как определить “лучшую” модель (т.е.
Data Science
Вопрос или проблема В настоящее время я работаю с набором данных из 55 тысяч записей и семи столбцов (один целевой переменной), три из которых являются номинальными категориальными. Другие три – это поля ‘описания’
Data Science
Вопрос или проблема У меня есть три модели нейронных сетей, которые я запускаю на одном и том же наборе данных (из 7 классов) и вычисляю их производительность по классам, а также ROC-кривые. Первая модель — это 4-слойная модель с 8 нейронами в каждом
Data Science
Вопрос или проблема У меня есть архитектура модели на основе CNN, которая принимает RGB изображение. Сейчас я пытаюсь изменить ее для задачи классификации цвета объекта (10 цветовых классов: белый, черный, желтый и т.д.). Эта архитектура ранее достигала
Data Science
Вопрос или проблема Во-первых, пожалуйста, простите мое невежество; я новичок, но готов учиться дальше. Пример: Я использую классификатор случайного леса для прогнозирования бинарного исхода. Бинарный исход равен 1, если люди в наборе данных когда-либо
Data Science
Вопрос или проблема Имея модель классификации с несколькими классами и n признаками, как я могу измерить неопределенность модели для данной классификации? Предположим, что для одного класса точность модели потрясающая, но для другого — нет.
Data Science
Вопрос или проблема Я пытаюсь использовать модель LSTM для бинарной классификации; однако, когда я обучаю модель, значение функции потерь остается около 0.69 (т.е. –$\ln(0.5)$), а точность на уровне 0.5, что наводит меня на мысль, что модель не
Data Science
Вопрос или проблема В нашем наборе данных есть 2 атрибута, citizen и nric. Правило такое: если citizen равен US, то result должно принимать значение nric, в противном случае Non-US. Не могли бы вы посоветовать, какой алгоритм в Weka я должен использовать
Data Science
Вопрос или проблема Я хочу построить [вероятностную] модель, которая стремится вывести истинное значение неизвестной категориальной переменной, $y \in \{1,2,…, K\}$. У нас есть набор данных $(X,y): \mathbb{R}^d\rightarrow \{1,2,…
Data Science
Вопрос или проблема Я решаю задачу классификации с несколькими классами, с меткой в следующей форме [1333201000], а логит-выход модели имеет следующий вид ([[0.4523, 0.0198, -0.1911, -0.0036], [0.4917, 0.4316, -0.2846, 0.0774], [0.
Data Science
Вопрос или проблема Я хочу обучить бинарный классификатор на текстах — что-то вроде анализа настроений, но мои входные векторы будут представлять собой серию ответов от пользователя, разделенных некоторым разделяющим символом.
Data Science
Вопрос или проблема Я пытаюсь построить SVM с нуля и хотел бы максимизировать это выражение Лагранжа: Я знаю, что означают переменные, но хотел бы узнать, как реализуется эта максимизация. Должен ли я начать с альфа, близкого к 0, и увеличивать его, пока
Data Science
Вопрос или проблема У меня есть написанные от руки классификаторы (их много). Они реализованы как набор правил ЕСЛИ - ТО. Я хочу оптимизировать процент ошибок. Есть некоторые классификаторы, у которых очень высокий процент ложных срабатываний и ложных отрицаний.
Data Science
Вопрос или проблема Просто ради удовольствия я сейчас пытаюсь найти подходящие места для размещения новых магазинов. Итак, что я сделал до сих пор: взял фактические места текущих магазинов и присвоил им окружающие переменные. Эти признаки включают, например
Data Science
Вопрос или проблема Я преобразовал все числовые целевые переменные датасета MNIST в категориальные переменные. Таким образом, 0 стало ноль и так далее. Затем я попробовал следующую модель на этом наборе данных: from sklearn.linear_model import SGDClassifier from sklearn.
Data Science
Вопрос или проблема Я новичок в машинном обучении и науке о данных. Мне бы очень хотелось получить совет на высоком уровне, как подойти к следующей задаче. Мне нужно предсказать, откажет ли двигатель, у меня есть датчик, который дает определенное значение
Data Science
Вопрос или проблема Я обычно стараюсь учитывать расходы в обучении. Настройка следующая: задача статистического обучения с обычными X и y, где y несбалансирован (примерно 1% единиц). Scikit learn обычно предлагает параметры весов, где вы можете установить
Data Science
Вопрос или проблема Алгоритм AdaBoost: Моя проблема заключается в том, как обучается классификатор $G_m(x)$. Что значит, что классификатор обучается с использованием весов $w_i$? Означает ли это подгонку классификатора через $\{w_i,y_i\}_{i=1}^{N}$?
Data Science
Вопрос или проблема Я новичок в машинном обучении, но за последние 2 дня я прочитал много о Reinforcement Learning. У меня есть приложение, которое извлекает список проектов (например, с Upwork). Есть модератор, который вручную принимает или отклоняет