Data Science
Ассоциативные правила для классификации
00
Вопрос или проблема Я работаю над проектом по классификации. У меня есть много строк, содержащих множество бинарных атрибутов, некоторые из которых часто встречаются вместе, точно так же, как это можно встретить в проблеме рыночной корзины (когда, например
Data Science
Как эффективно оценить модель с сильно несбалансированным и ограниченным набором данных
00
Вопрос или проблема Большинство вопросов о дисбалансе данных на этом сайте касаются того, как обучить лучшую модель, но я склонен считать, что другая проблема заключается в том, как определить “лучшую” модель (т.е.
Data Science
Как использовать данные описания в многоклассовой классификации (снижение размерности)
00
Вопрос или проблема В настоящее время я работаю с набором данных из 55 тысяч записей и семи столбцов (один целевой переменной), три из которых являются номинальными категориальными. Другие три – это поля ‘описания’
Data Science
Соотношение кривых ROC со статистикой классов
00
Вопрос или проблема У меня есть три модели нейронных сетей, которые я запускаю на одном и том же наборе данных (из 7 классов) и вычисляю их производительность по классам, а также ROC-кривые. Первая модель — это 4-слойная модель с 8 нейронами в каждом
Data Science
Как оптимизировать архитектуру своей CNN классификации
00
Вопрос или проблема У меня есть архитектура модели на основе CNN, которая принимает RGB изображение. Сейчас я пытаюсь изменить ее для задачи классификации цвета объекта (10 цветовых классов: белый, черный, желтый и т.д.). Эта архитектура ранее достигала
Data Science
Какие метрики classification_report лучше всего сообщать/интерпретировать для бинарной метки? Индивидуальные или макро средние для обоих классов? scikit-learn
00
Вопрос или проблема Во-первых, пожалуйста, простите мое невежество; я новичок, но готов учиться дальше. Пример: Я использую классификатор случайного леса для прогнозирования бинарного исхода. Бинарный исход равен 1, если люди в наборе данных когда-либо
Data Science
Измерение неопределенности прогнозов
00
Вопрос или проблема Имея модель классификации с несколькими классами и n признаками, как я могу измерить неопределенность модели для данной классификации? Предположим, что для одного класса точность модели потрясающая, но для другого — нет.
Data Science
Использование LSTM для предсказания бинарной классификации – точность застряла на уровне 50% – как использовать statefulness.
00
Вопрос или проблема Я пытаюсь использовать модель LSTM для бинарной классификации; однако, когда я обучаю модель, значение функции потерь остается около 0.69 (т.е. –$\ln(0.5)$), а точность на уровне 0.5, что наводит меня на мысль, что модель не
Data Science
Классификация текста с помощью Weka (неограниченное количество значений зависимой переменной)
01
Вопрос или проблема В нашем наборе данных есть 2 атрибута, citizen и nric. Правило такое: если citizen равен US, то result должно принимать значение nric, в противном случае Non-US. Не могли бы вы посоветовать, какой алгоритм в Weka я должен использовать
Data Science
Как обновить апостериорное убеждение, когда мы наблюдаем поток коррелированных данных из фиксированного, но неизвестного источника данных?
00
Вопрос или проблема Я хочу построить [вероятностную] модель, которая стремится вывести истинное значение неизвестной категориальной переменной, $y \in \{1,2,…, K\}$. У нас есть набор данных $(X,y): \mathbb{R}^d\rightarrow \{1,2,…
Data Science
Потеря по кросс-энтропии для проблемы многоклассовой классификации
00
Вопрос или проблема Я решаю задачу классификации с несколькими классами, с меткой в следующей форме [1333201000], а логит-выход модели имеет следующий вид ([[0.4523, 0.0198, -0.1911, -0.0036], [0.4917, 0.4316, -0.2846, 0.0774], [0.
Data Science
Обучение модели с рядом текстовых ответов в качестве входных данных.
00
Вопрос или проблема Я хочу обучить бинарный классификатор на текстах — что-то вроде анализа настроений, но мои входные векторы будут представлять собой серию ответов от пользователя, разделенных некоторым разделяющим символом.
Data Science
Как реализовать SVM с нуля?
00
Вопрос или проблема Я пытаюсь построить SVM с нуля и хотел бы максимизировать это выражение Лагранжа: Я знаю, что означают переменные, но хотел бы узнать, как реализуется эта максимизация. Должен ли я начать с альфа, близкого к 0, и увеличивать его, пока
Data Science
Алгоритм оптимизации набора правил
00
Вопрос или проблема У меня есть написанные от руки классификаторы (их много). Они реализованы как набор правил ЕСЛИ - ТО. Я хочу оптимизировать процент ошибок. Есть некоторые классификаторы, у которых очень высокий процент ложных срабатываний и ложных отрицаний.
Data Science
Найдите подходящие места с помощью машинного обучения.
00
Вопрос или проблема Просто ради удовольствия я сейчас пытаюсь найти подходящие места для размещения новых магазинов. Итак, что я сделал до сих пор: взял фактические места текущих магазинов и присвоил им окружающие переменные. Эти признаки включают, например
Data Science
Оценка модели с категориальными целевыми переменными
00
Вопрос или проблема Я преобразовал все числовые целевые переменные датасета MNIST в категориальные переменные. Таким образом, 0 стало ноль и так далее. Затем я попробовал следующую модель на этом наборе данных: from sklearn.linear_model import SGDClassifier from sklearn.
Data Science
Как подойти к проблеме прогнозирования данных
00
Вопрос или проблема Я новичок в машинном обучении и науке о данных. Мне бы очень хотелось получить совет на высоком уровне, как подойти к следующей задаче. Мне нужно предсказать, откажет ли двигатель, у меня есть датчик, который дает определенное значение
Data Science
Учитывая стоимость экземпляра в обучении?
00
Вопрос или проблема Я обычно стараюсь учитывать расходы в обучении. Настройка следующая: задача статистического обучения с обычными X и y, где y несбалансирован (примерно 1% единиц). Scikit learn обычно предлагает параметры весов, где вы можете установить
Data Science
Как обучается одиночный классификатор в AdaBoost?
00
Вопрос или проблема Алгоритм AdaBoost: Моя проблема заключается в том, как обучается классификатор $G_m(x)$. Что значит, что классификатор обучается с использованием весов $w_i$? Означает ли это подгонку классификатора через $\{w_i,y_i\}_{i=1}^{N}$?
Data Science
Алгоритм усиления для бинарной классификации
00
Вопрос или проблема Я новичок в машинном обучении, но за последние 2 дня я прочитал много о Reinforcement Learning. У меня есть приложение, которое извлекает список проектов (например, с Upwork). Есть модератор, который вручную принимает или отклоняет