classification - ответы на вопросы - Page 5 of 13

Data Science

Классификация звуков для нескольких классов английских букв

00

Вопрос или проблема Я записал аудиофайлы для английских букв, каждый файл включает 26 букв. Я разделил каждую букву на отдельный аудиофайл. Теперь я хочу поместить подобные аудиобуквы в одну папку. Я могу сделать это вручную, но это займет время.

Data Science

Прогностические модели для несбалансированных данных

00

Вопрос или проблема У меня есть данные с метками $y_i \in \{0,1\}$ и некоторыми признаками $x_i$. Большинство $y$ равны 0 (например, 99% к 1%). Я хочу построить модель классификации с помощью случайного леса на этих данных. Я задумался, используется ли

Data Science

Как использовать ядро размера 5 на 5 или 7 на 7 для сети глубокого обучения с ядрами 3 на 3?

00

Вопрос или проблема Я использую архитектуру U-Net. Визуальная область сегментационной маски очень мала, и после обучения она дает много ложных срабатываний. Я думаю о том, чтобы изменить размер ядра с 3 на 3 на 5 на 5. Какие меры предосторожности мне

Data Science

Сравнение вероятностей двух моделей

00

Вопрос или проблема Рассмотрим набор данных и два бинарных класса CLASS_A и CLASS_B. Предположим, что мы обучаем модель, такую как XGBClassifier, для обоих классов (отдельно) и получаем две модели: MODEL_A для предсказания CLASS_A и MODEL_B для предсказания CLASS_B.

Data Science

Интерпретация предсказанных вероятностей после ребалансировки

00

Вопрос или проблема Рассмотрим ситуацию, в которой у меня есть несбалансированный набор данных, где целевой класс принимает значение = 1 в 0,01% наблюдений и значение = 0 в 99,9% наблюдений. Я обучаю модель классификации, скажем, XGBClassifier и получаю

Data Science

Проблемы с нахождением модели LSTM для классификации

00

Вопрос или проблема Я провожу исследование по классификации музыкальных жанров с использованием методов глубокого обучения. Работа состоит в том, чтобы сделать классификацию с использованием модели LSTM. Я использую GTZAN как набор данных и предварительно

Data Science

Проверьте ложную классификацию

00

Вопрос или проблема Недавно я смог обучить простой классификационный алгоритм (мой первый ML-проект) и даже получил довольно удовлетворительную точность. Теперь я ищу способ проверить, какие данные в моем train_data были ошибочно классифицированы.

Data Science

Странное распределение выходных данных нейронной сети

00

Вопрос или проблема Я столкнулся с необычным поведением при обучении нейронной сети. Задача состоит в том, чтобы предсказать, принадлежит ли образец к первому или второму классу. (Классификация на 2 класса). Классы несбалансированы (~ 5 / 95).

Data Science

Настройка многоклассовой классификации

00

Вопрос или проблема 1) Какие функции активации и потерь являются подходящими для задачи многоклассовой классификации? Так ли это: До 2 классов $\rightarrow$ Бинарная классификация $\rightarrow$ Активация: Сигмоида $\rightarrow$ Потеря: binary_crossentropy

Data Science

как работать с NLP и другими функциями

00

Вопрос или проблема Мой набор данных выглядит следующим образом Тип_Спорта Город Текст_Отчета Метки Мяч Торонто Месси был объявлен лучшим футбольным игроком... Футбол Плавание Лондон Новые рекорды сегодня в баттерфляе и на спине.

Data Science

Могу ли я добавить новый выходной класс в декодер и обучить только последний слой?

00

Вопрос или проблема Я задумываюсь, как подойти к проекту, где я хотел бы увеличить количество выходных классов уже обученной сети. У меня есть очень веские основания полагать, что модель уже усвоила соответствующую информацию, чтобы предсказать этот новый

Data Science

Классификация на основе нерегулярного количества признаков

00

Вопрос или проблема Итак, я пытаюсь классифицировать довольно большой набор данных, где обучающий набор имеет некоторые странные проблемы… Для каждой строки доступно разное количество признаков. Например, для одного предсказания у меня может быть

Data Science

Способы увеличения полноты в SVM

00

Вопрос или проблема Я обучаю SVM на Наборе данных о банковском маркетинге от UCI, файле bank additional-full.csv. Поскольку данные смещены, я также интересуюсь полнотой. Я получаю точность около 87.95%, но моя полнота составляет примерно 51%.

Data Science

Преобразование признаков для адаптации по домену: Модификация аномальных данных для соответствия нормальным распределениям признаков.

00

Вопрос или проблема Пусть $X$ представляет собой набор данных, состоящий из $N$ экземпляров, где каждый экземпляр описывается набором признаков $\text{feat}_0, \ldots, \text{feat}_m$, а $Y$ обозначает соответствующие целевые значения.

Data Science

Почему я получаю неправильное предсказание, когда комбинирую два списка образцов, каждый из которых по отдельности дает правильное предсказание?

00

Вопрос или проблема Я программирую на Python. У меня есть два набора образцов. Набор1 содержит образцы класса A, а другой набор, Набор2, содержит образцы класса B. Эти образцы являются частью обучающего набора данных. Когда я предсказываю наборы 1 и 2

Data Science

Модель DL для оценки качества изображения

00

Вопрос или проблема У меня есть идея, но я не уверен, что ее можно смоделировать в архитектуре глубокого обучения. Предположим, у нас есть изображения разного качества, основанные на цветовом паттерне, и их оценка в качестве меток в диапазоне от 0 до 1.

Data Science

Как можно использовать TransformerXL для классификации текста?

02

Вопрос или проблема Для нормального трансформера только с кодировщиком, такого как BERT, я знаю, что мы можем добавить токен CLS к входным данным, который “агрегирует” информацию из всех других токенов. Затем мы можем прикрепить MLP к этому

Data Science

Оптимизированные алгоритмы для устранения признаков на основе корреляции

00

Вопрос или проблема У меня есть большой датафрейм с почти миллионом строк и 2000 столбцов. Я пытаюсь сделать отбор признаков, используя корреляцию между переменными. Проблема в том, что для набора из n признаков нам нужна корреляция между nC2 или n*(n-1)/2

Data Science

Мой набор данных не поддается обучению или моя модель LSTM недостаточно умная?

00

Вопрос или проблема У меня есть данные временного ряда, полученные из видео. Данные состоят из пар битрейтов и соответствующих меток для каждой временной метки: Распределение за первые 30 секунд выглядит следующим образом: Я построил модель LSTM для этого

Data Science

Сравните производительность классификации подмножеств данных на основе факторов.

00

Вопрос или проблема Допустим, у меня есть набор данных, на котором я хочу провести классификацию: id признак класс фактор 1 … 1 A 2 … 1 B $\vdots$ Как я могу сравнить производительность модели, учитывая значения фактора?