Data Science
Классификация звуков для нескольких классов английских букв
00
Вопрос или проблема Я записал аудиофайлы для английских букв, каждый файл включает 26 букв. Я разделил каждую букву на отдельный аудиофайл. Теперь я хочу поместить подобные аудиобуквы в одну папку. Я могу сделать это вручную, но это займет время.
Data Science
Прогностические модели для несбалансированных данных
00
Вопрос или проблема У меня есть данные с метками $y_i \in \{0,1\}$ и некоторыми признаками $x_i$. Большинство $y$ равны 0 (например, 99% к 1%). Я хочу построить модель классификации с помощью случайного леса на этих данных. Я задумался, используется ли
Data Science
Как использовать ядро размера 5 на 5 или 7 на 7 для сети глубокого обучения с ядрами 3 на 3?
00
Вопрос или проблема Я использую архитектуру U-Net. Визуальная область сегментационной маски очень мала, и после обучения она дает много ложных срабатываний. Я думаю о том, чтобы изменить размер ядра с 3 на 3 на 5 на 5. Какие меры предосторожности мне
Data Science
Сравнение вероятностей двух моделей
00
Вопрос или проблема Рассмотрим набор данных и два бинарных класса CLASS_A и CLASS_B. Предположим, что мы обучаем модель, такую как XGBClassifier, для обоих классов (отдельно) и получаем две модели: MODEL_A для предсказания CLASS_A и MODEL_B для предсказания CLASS_B.
Data Science
Интерпретация предсказанных вероятностей после ребалансировки
00
Вопрос или проблема Рассмотрим ситуацию, в которой у меня есть несбалансированный набор данных, где целевой класс принимает значение = 1 в 0,01% наблюдений и значение = 0 в 99,9% наблюдений. Я обучаю модель классификации, скажем, XGBClassifier и получаю
Data Science
Проблемы с нахождением модели LSTM для классификации
00
Вопрос или проблема Я провожу исследование по классификации музыкальных жанров с использованием методов глубокого обучения. Работа состоит в том, чтобы сделать классификацию с использованием модели LSTM. Я использую GTZAN как набор данных и предварительно
Data Science
Проверьте ложную классификацию
00
Вопрос или проблема Недавно я смог обучить простой классификационный алгоритм (мой первый ML-проект) и даже получил довольно удовлетворительную точность. Теперь я ищу способ проверить, какие данные в моем train_data были ошибочно классифицированы.
Data Science
Странное распределение выходных данных нейронной сети
00
Вопрос или проблема Я столкнулся с необычным поведением при обучении нейронной сети. Задача состоит в том, чтобы предсказать, принадлежит ли образец к первому или второму классу. (Классификация на 2 класса). Классы несбалансированы (~ 5 / 95).
Data Science
Настройка многоклассовой классификации
00
Вопрос или проблема 1) Какие функции активации и потерь являются подходящими для задачи многоклассовой классификации? Так ли это: До 2 классов $\rightarrow$ Бинарная классификация $\rightarrow$ Активация: Сигмоида $\rightarrow$ Потеря: binary_crossentropy
Data Science
как работать с NLP и другими функциями
00
Вопрос или проблема Мой набор данных выглядит следующим образом Тип_Спорта Город Текст_Отчета Метки Мяч Торонто Месси был объявлен лучшим футбольным игроком... Футбол Плавание Лондон Новые рекорды сегодня в баттерфляе и на спине.
Data Science
Могу ли я добавить новый выходной класс в декодер и обучить только последний слой?
00
Вопрос или проблема Я задумываюсь, как подойти к проекту, где я хотел бы увеличить количество выходных классов уже обученной сети. У меня есть очень веские основания полагать, что модель уже усвоила соответствующую информацию, чтобы предсказать этот новый
Data Science
Классификация на основе нерегулярного количества признаков
00
Вопрос или проблема Итак, я пытаюсь классифицировать довольно большой набор данных, где обучающий набор имеет некоторые странные проблемы… Для каждой строки доступно разное количество признаков. Например, для одного предсказания у меня может быть
Data Science
Способы увеличения полноты в SVM
00
Вопрос или проблема Я обучаю SVM на Наборе данных о банковском маркетинге от UCI, файле bank additional-full.csv. Поскольку данные смещены, я также интересуюсь полнотой. Я получаю точность около 87.95%, но моя полнота составляет примерно 51%.
Data Science
Преобразование признаков для адаптации по домену: Модификация аномальных данных для соответствия нормальным распределениям признаков.
00
Вопрос или проблема Пусть $X$ представляет собой набор данных, состоящий из $N$ экземпляров, где каждый экземпляр описывается набором признаков $\text{feat}_0, \ldots, \text{feat}_m$, а $Y$ обозначает соответствующие целевые значения.
Data Science
Почему я получаю неправильное предсказание, когда комбинирую два списка образцов, каждый из которых по отдельности дает правильное предсказание?
00
Вопрос или проблема Я программирую на Python. У меня есть два набора образцов. Набор1 содержит образцы класса A, а другой набор, Набор2, содержит образцы класса B. Эти образцы являются частью обучающего набора данных. Когда я предсказываю наборы 1 и 2
Data Science
Модель DL для оценки качества изображения
00
Вопрос или проблема У меня есть идея, но я не уверен, что ее можно смоделировать в архитектуре глубокого обучения. Предположим, у нас есть изображения разного качества, основанные на цветовом паттерне, и их оценка в качестве меток в диапазоне от 0 до 1.
Data Science
Как можно использовать TransformerXL для классификации текста?
02
Вопрос или проблема Для нормального трансформера только с кодировщиком, такого как BERT, я знаю, что мы можем добавить токен CLS к входным данным, который “агрегирует” информацию из всех других токенов. Затем мы можем прикрепить MLP к этому
Data Science
Оптимизированные алгоритмы для устранения признаков на основе корреляции
00
Вопрос или проблема У меня есть большой датафрейм с почти миллионом строк и 2000 столбцов. Я пытаюсь сделать отбор признаков, используя корреляцию между переменными. Проблема в том, что для набора из n признаков нам нужна корреляция между nC2 или n*(n-1)/2
Data Science
Мой набор данных не поддается обучению или моя модель LSTM недостаточно умная?
00
Вопрос или проблема У меня есть данные временного ряда, полученные из видео. Данные состоят из пар битрейтов и соответствующих меток для каждой временной метки: Распределение за первые 30 секунд выглядит следующим образом: Я построил модель LSTM для этого
Data Science
Сравните производительность классификации подмножеств данных на основе факторов.
00
Вопрос или проблема Допустим, у меня есть набор данных, на котором я хочу провести классификацию: id признак класс фактор 1 … 1 A 2 … 1 B $\vdots$ Как я могу сравнить производительность модели, учитывая значения фактора?