classification - ответы на вопросы - Page 2 of 13

Data Science

00

Вопрос или проблема Я работаю над проектом по классификации. У меня есть много строк, содержащих множество бинарных атрибутов, некоторые из которых часто встречаются вместе, точно так же, как это можно встретить в проблеме рыночной корзины (когда, например

Data Science

Как эффективно оценить модель с сильно несбалансированным и ограниченным набором данных

00

Вопрос или проблема Большинство вопросов о дисбалансе данных на этом сайте касаются того, как обучить лучшую модель, но я склонен считать, что другая проблема заключается в том, как определить “лучшую” модель (т.е.

Data Science

Как использовать данные описания в многоклассовой классификации (снижение размерности)

00

Вопрос или проблема В настоящее время я работаю с набором данных из 55 тысяч записей и семи столбцов (один целевой переменной), три из которых являются номинальными категориальными. Другие три – это поля ‘описания’

Data Science

Соотношение кривых ROC со статистикой классов

00

Вопрос или проблема У меня есть три модели нейронных сетей, которые я запускаю на одном и том же наборе данных (из 7 классов) и вычисляю их производительность по классам, а также ROC-кривые. Первая модель — это 4-слойная модель с 8 нейронами в каждом

Data Science

Как оптимизировать архитектуру своей CNN классификации

00

Вопрос или проблема У меня есть архитектура модели на основе CNN, которая принимает RGB изображение. Сейчас я пытаюсь изменить ее для задачи классификации цвета объекта (10 цветовых классов: белый, черный, желтый и т.д.). Эта архитектура ранее достигала

Data Science

Какие метрики classification_report лучше всего сообщать/интерпретировать для бинарной метки? Индивидуальные или макро средние для обоих классов? scikit-learn

00

Вопрос или проблема Во-первых, пожалуйста, простите мое невежество; я новичок, но готов учиться дальше. Пример: Я использую классификатор случайного леса для прогнозирования бинарного исхода. Бинарный исход равен 1, если люди в наборе данных когда-либо

Data Science

Измерение неопределенности прогнозов

00

Вопрос или проблема Имея модель классификации с несколькими классами и n признаками, как я могу измерить неопределенность модели для данной классификации? Предположим, что для одного класса точность модели потрясающая, но для другого — нет.

Data Science

Использование LSTM для предсказания бинарной классификации – точность застряла на уровне 50% – как использовать statefulness.

00

Вопрос или проблема Я пытаюсь использовать модель LSTM для бинарной классификации; однако, когда я обучаю модель, значение функции потерь остается около 0.69 (т.е. –$\ln(0.5)$), а точность на уровне 0.5, что наводит меня на мысль, что модель не

Data Science

Классификация текста с помощью Weka (неограниченное количество значений зависимой переменной)

01

Вопрос или проблема В нашем наборе данных есть 2 атрибута, citizen и nric. Правило такое: если citizen равен US, то result должно принимать значение nric, в противном случае Non-US. Не могли бы вы посоветовать, какой алгоритм в Weka я должен использовать

Data Science

Как обновить апостериорное убеждение, когда мы наблюдаем поток коррелированных данных из фиксированного, но неизвестного источника данных?

00

Вопрос или проблема Я хочу построить [вероятностную] модель, которая стремится вывести истинное значение неизвестной категориальной переменной, $y \in \{1,2,…, K\}$. У нас есть набор данных $(X,y): \mathbb{R}^d\rightarrow \{1,2,…

Data Science

Потеря по кросс-энтропии для проблемы многоклассовой классификации

00

Вопрос или проблема Я решаю задачу классификации с несколькими классами, с меткой в следующей форме [1333201000], а логит-выход модели имеет следующий вид ([[0.4523, 0.0198, -0.1911, -0.0036], [0.4917, 0.4316, -0.2846, 0.0774], [0.

Data Science

Обучение модели с рядом текстовых ответов в качестве входных данных.

00

Вопрос или проблема Я хочу обучить бинарный классификатор на текстах — что-то вроде анализа настроений, но мои входные векторы будут представлять собой серию ответов от пользователя, разделенных некоторым разделяющим символом.

Data Science

Как реализовать SVM с нуля?

00

Вопрос или проблема Я пытаюсь построить SVM с нуля и хотел бы максимизировать это выражение Лагранжа: Я знаю, что означают переменные, но хотел бы узнать, как реализуется эта максимизация. Должен ли я начать с альфа, близкого к 0, и увеличивать его, пока

Data Science

Алгоритм оптимизации набора правил

00

Вопрос или проблема У меня есть написанные от руки классификаторы (их много). Они реализованы как набор правил ЕСЛИ - ТО. Я хочу оптимизировать процент ошибок. Есть некоторые классификаторы, у которых очень высокий процент ложных срабатываний и ложных отрицаний.

Data Science

Найдите подходящие места с помощью машинного обучения.

00

Вопрос или проблема Просто ради удовольствия я сейчас пытаюсь найти подходящие места для размещения новых магазинов. Итак, что я сделал до сих пор: взял фактические места текущих магазинов и присвоил им окружающие переменные. Эти признаки включают, например

Data Science

Оценка модели с категориальными целевыми переменными

00

Вопрос или проблема Я преобразовал все числовые целевые переменные датасета MNIST в категориальные переменные. Таким образом, 0 стало ноль и так далее. Затем я попробовал следующую модель на этом наборе данных: from sklearn.linear_model import SGDClassifier from sklearn.

Data Science

Как подойти к проблеме прогнозирования данных

00

Вопрос или проблема Я новичок в машинном обучении и науке о данных. Мне бы очень хотелось получить совет на высоком уровне, как подойти к следующей задаче. Мне нужно предсказать, откажет ли двигатель, у меня есть датчик, который дает определенное значение

Data Science

Учитывая стоимость экземпляра в обучении?

00

Вопрос или проблема Я обычно стараюсь учитывать расходы в обучении. Настройка следующая: задача статистического обучения с обычными X и y, где y несбалансирован (примерно 1% единиц). Scikit learn обычно предлагает параметры весов, где вы можете установить

Data Science

Как обучается одиночный классификатор в AdaBoost?

00

Вопрос или проблема Алгоритм AdaBoost: Моя проблема заключается в том, как обучается классификатор $G_m(x)$. Что значит, что классификатор обучается с использованием весов $w_i$? Означает ли это подгонку классификатора через $\{w_i,y_i\}_{i=1}^{N}$?

Data Science

Алгоритм усиления для бинарной классификации

00

Вопрос или проблема Я новичок в машинном обучении, но за последние 2 дня я прочитал много о Reinforcement Learning. У меня есть приложение, которое извлекает список проектов (например, с Upwork). Есть модератор, который вручную принимает или отклоняет