classification - ответы на вопросы - Page 8 of 13

Data Science

00

Вопрос или проблема У меня есть задача бинарной классификации. Я разработал модель с свёрточными ядрами на первых слоях, а затем плотными слоями. В качестве выходного слоя я использовал softmax слой размером 2, а затем применил one-hot кодирование к своим меткам.

Data Science

Как работать с категориальными переменными при масштабировании

00

Вопрос или проблема У меня есть классификатор MLP, который используется для решения задачи бинарной классификации (например, категория A против B). Моя цель – минимизировать логарифмическую потерю, однако один из тестов, который я провожу, –

Data Science

Извлечение ключевых слов для классификации текстов бизнес-правил

00

Вопрос или проблема Я хотел бы классифицировать тексты без использования каких-либо моделей машинного обучения. Моя идея состоит в том, чтобы составить список ключевых слов, которые я назначу каждой категории. Затем, когда мне нужно будет классифицировать

Data Science

Классификация временных рядов с несколькими строками на дату

00

Вопрос или проблема У меня есть набор временных рядов данных с жизненным циклом 9000 различных B2B продажных лидов. То, что я называю жизненным циклом, представляет собой набор данных с одной записью на день для каждого различного идентификатора лидов

Data Science

Какую предсказательную модель выбрать?

00

Вопрос или проблема Я полностью потерялся, пытаясь выбрать тип предсказательной модели для своей задачи. Это авторегрессионная модель, нелинейная временная серия, марковская цепь или что-то другое? Может кто-то дать мне совет?

Data Science

Как использовать онтологии для классификации текста?

00

Вопрос или проблема Я новичок в машинном обучении и хочу классифицировать предложения, используя онтологии (таксономии/графы знаний) и методы контролируемого обучения (у меня есть аннотированный обучающий набор данных). Мой вопрос: как использовать онтологию для этой задачи?

Data Science

Как передавать входные данные в модели глубокого обучения для задачи ответа на множественный выбор?

00

Вопрос или проблема В настоящее время я работаю над системой ответов на вопросы с множественным выбором. Обучающая выборка состоит из вопроса, ответа и 4 вариантов, и мне нужно предсказать правильный ответ среди 4 вариантов. Иногда есть и один абзац, например: 1.

Data Science

Симуляция данных с использованием make_classification в Python

00

Вопрос или проблема У меня есть вопрос о моделировании данных в Python. Я занимаюсь классификацией несбалансированных данных и хочу протестировать эффективность различных методов на смоделированных данных. Я видел в различных статьях и книгах, что функция

Data Science

Предварительная обработка многомерных данных

00

Вопрос или проблема Я пытаюсь понять, как работает предобработка многомерных данных, но у меня есть несколько вопросов. Например, я могу выполнять сглаживание данных, преобразование (бокс-кокс, дифференцирование), удаление шума в одномерных данных (для

Data Science

Случайный лес всегда прогнозирует класс большинства

01

Вопрос или проблема Я предсказываю исход болезни, используя биологические данные (метаболиты плюс ковариаты: возраст, пол и ИМТ). Исход является бинарной переменной и умеренно несбалансирован (~12% положительных случаев). У меня относительно большое число

Data Science

Бинарная классификация текста с помощью SpaCy

01

Вопрос или проблема У меня есть набор данных из двух папок. Одна из них содержит документы (текст, PDF), связанные с личной информацией (например, имя, электронная почта, адрес и т. д.), другая содержит неперсонализированную информацию.

Data Science

Масштабирование и нессимметричные преобразования признаков для классификации

00

Вопрос или проблема Я хочу преобразовать некоторые значения признаков в своей модели, используя кубический корень, чтобы уменьшить некоторую асимметрию в своих данных. Однако я заметил, что после того, как я применяю кубический корень к определенным признакам

Data Science

Нужно ли использовать AUPRC для отчетности о результатах классификации на несбалансированном наборе данных, если модель была обучена с использованием увеличения выборки и кросс-валидации?

00

Вопрос или проблема Я работаю над задачей бинарной классификации, в которой в датасете содержится около 5% положительных классов. Я разделил датасет на 70% для обучения и 30% для тестирования. Я использовал тестовые данные только один раз для оценки производительности модели.

Data Science

Можно ли заменить категориальные данные на числа в задачах классификации?

00

Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.

Data Science

Как использовать иерархическую переменную в модели машинного обучения

00

Вопрос или проблема Я работаю над задачей бинарной классификации с 1000 строками и 20 переменными. У меня есть такие переменные, как product_id, city, state, country, product family, product type, product segment и так далее. Как видно, большинство моих

Data Science

Выбор подмножества населения таким образом, чтобы распределение определенной переменной в подмножестве соответствовало эталонному распределению.

00

Вопрос или проблема У меня есть большая популяция ($P$) записей, и мне дана распределение определенной переменной ($x_0$) для конкретного подмножества ($S$) этой популяции. Подмножество $S$ не является случайной выборкой, и, следовательно, распределение

Data Science

Как применить модель к обучающим данным для выявления неправильно размеченных наблюдений?

00

Вопрос или проблема У меня есть список людей, атрибуты этих людей (рост, вес, кровяное давление и т. д.) и двоичная целевая переменная, называемая has_heart_issues. Эти данные представляют собой полную популяцию данных, и я пытаюсь определить, похожи

Программное обеспечение

Альтернатива классификатору электронной почты POPFile

00

Вопрос или проблема Я использую POPFile уже много лет, но он не обновлялся годами. POPFile — это байесовский классификатор электронной почты. Обычно вы связываете это со спамом — это спам или не спам. Байесовские фильтры отлично справляются с этой задачей.

Data Science

Архитектура распознавания лиц

00

Вопрос или проблема Распознавание изображений использует глубокое обучение, а именно сверточные нейронные сети (CNN), для обучения и распознавания лиц. Обычно это подразумевает обучение на большом объеме данных. Однако в последнее время мы видим, как

Data Science

Можно ли использовать рекомендательную систему в качестве бинарного классификатора?

00

Вопрос или проблема У меня есть проект по созданию компьютерной музыки, и я хотел бы классифицировать короткие фрагменты музыки как “хорошие” или “плохие” с помощью машинного обучения. У меня не будет большого набора для обучения.