Data Science
Как объяснить относительную разницу между макро-AUC и макро-F1 в задаче многоклассовой классификации?
00
Вопрос или проблема На днях я опубликовал статью, в которой результат модели с учителем следующий. Все метрики усредненные по классу. Меня попросили прокомментировать разницу между AUC и другими метриками, в частности F1. Быстро это относительно сбалансированная задача.
Data Science
Как рассчитывается ошибка с несколькими выходными нейронами в нейронной сети?
00
Вопрос или проблема Книги по машинному обучению в общем описывают, что ошибка, рассчитанная для данной выборки $i$, определяется следующим образом: $e_i = y_i – \hat{y_i}$ Где $\hat{y}$ — это целевой выход, а $y$ — это фактический выход, получаемый сетью.
Data Science
Группировка похожих классов для повышения точности, при этом максимизируя количество классов.
00
Вопрос или проблема Предположим, у меня есть множество различных классов, некоторые из которых связаны между собой. Моя модель имеет высокую точность классификации для некоторых классов, в то время как другие классы сложно предсказать.
Data Science
Мультиклассовый набор данных с множеством признаков, приводящий к плохой точности предсказаний.
00
Вопрос или проблема Я пытался это исправить в течение 2 месяцев, но без успеха. Я провожу медицинское исследование для своей учебы. У меня есть набор данных, в котором указаны диагнозы пациентов на основе медицинских отчетов (Features.
Data Science
лучший подход для обучения CNN с несколькими подкатегориями и одной категорией
00
Вопрос или проблема Мне нужно классифицировать изображения на 2 категории: одобренные и отклоненные. Категория отклоненных имеет разные типы изображений, которые не разрешены (подкатегории), например, нуд или графические картинки с насилием, или аниме и т.
Data Science
Как справиться с переобучением в следующем случае классификации
00
Вопрос или проблема Матрица путаницы представлена ниже :- [[ 0 0 5 1 0 0] [ 0 0 19 14 0 0] [ 0 0 217 151 0 0] [ 0 0 84 282 0 0] [ 0 0 6 111 0 0] [ 0 0 0 10 0 0]] np.random.seed(0) classifier = Sequential() classifier.add(Dense(300,input_dim=11)) […]
Data Science
Прогнозирование недавности-частоты-деньги (RFM) через классификацию характеристик клиентов
00
Вопрос или проблема У меня есть RFM модель, которую я использую для сегментации клиентов на основе RFM оценки. Что я хотел бы сделать: Понять больше о характеристиках моих клиентов, чем просто их RFM оценка; Суметь предсказать, к какому сегменту RFM
Data Science
Как правильно использовать вейвлет-преобразование для извлечения признаков?
00
Вопрос или проблема Я пытаюсь классифицировать слова на основе сигналов ЭМГ, используя машину опорных векторов в качестве модели. Мой набор данных включает 15 классов (слов) с 230 повторами и 1000 признаками каждое. Я уже объединил все файлы вместе, чтобы упростить задачу.
Data Science
Как оценить точность на большом наборе данных?
00
Вопрос или проблема Учитывая, что у меня есть модель глубокого обучения (передача от бывшего коллеги). По какой-то причине наборы для обучения и валидации отсутствовали. В моей ситуации я хочу классифицировать свои данные на 100 категорий.
Data Science
Когда мне следует делать разделение на обучающую и тестовую выборки, а также отбор признаков, если мой набор данных несбалансированный?
00
Вопрос или проблема У меня есть набор данных, содержащий ЭКГ-сигналы с 5 различными классами, описывающими качество конкретного окна ЭКГ-сигнала. Мне нужно создать модель машинного обучения для предсказания качества сигнала на основе признаков, извлеченных из каждого окна.
Data Science
Задача многоклассовой классификации с несколькими целями для прогнозирования
00
Вопрос или проблема У нас есть задача классификации с несколькими классами под контролем, где необходимо предсказать две цели для каждого образца: ‘бренд’ и ‘категория’. Наши признаки – ‘shop_name’
Data Science
Оптимизируйте F-оценку только для определенных классов, игнорируя другие классы.
00
Вопрос или проблема У меня есть размеченный набор данных с обзорами продуктов, где метка — это оценка от 1 до 5, а обзор — просто текст. Я использую простой наивный байесовский классификатор (sklearn), чтобы попытаться предсказать оценку, учитывая обзор
Data Science
как обрабатывать задачи классификации с несовместимыми метками?
00
Вопрос или проблема Я работаю над задачей классификации, где экземпляры могут одновременно принадлежать нескольким классам. Например: Фильм может быть отмечен несколькими жанрами, такими как “Экшен”, “Комедия”
Data Science
ROC_AUC значение выше до настройки n_neighbors для KNN.
00
Вопрос или проблема Это для многоклассовой классификации. Перед настройкой n_neighbors для KNN результаты были следующие: Точность на обучающей выборке: 99.54% Точность на тестовой выборке: 99.58% ROC AUC: 99.86% После поиска оптимального n_neighbors
Data Science
Согласование многопиковых гистограмм
00
Вопрос или проблема Я анализирую множество файлов данных, которые представляют собой реакцию клеток на добавление препарата. Если препарат не добавляется, клетка реагирует нормально, если он добавляется, она показывает аномальные паттерны: , .
Data Science
Является ли это подходящим способом для расчета диаграммы надежности многоклассовой модели для калибровки?
00
Вопрос или проблема Я пытаюсь обобщить диаграммы надежности [1] для многоклассового классификатора и реализовать это с использованием pytorch и pytorch-metrics. Пока все хорошо, но я немного запутан в определении точности и том, как это применимо к пересечению
Data Science
Можно ли заменить категориальные данные на числа в задачах классификации?
00
Вопрос или проблема Я работаю с данными классификации, которые имеют 9 классов и множество признаков. Классы, очевидно, категориальные, как и некоторые признаки. Я использовал технику одноразового кодирования для преобразования категориальных данных в числовые.
Data Science
Адаптация медицинского трансформера для сегментации ран с несколькими классами
00
Вопрос или проблема Я использую Medical Transformer (https://github.com/jeya-maria-jose/Medical-Transformer) для сегментации ран, но хотел бы адаптировать его для сегментации трех различных классов: раны, дополнительный маркер и фон.
Data Science
Модель идентификации говорящих на основе глубокого обучения Keras показывает отличные результаты во время обучения, а затем проваливает предсказания.
00
Вопрос или проблема Я пытаюсь создать модель идентификации говорящего 1:N с использованием Keras и TensorFlow в качестве бэкенда. Я использовал корпус LibriSpeech для обучающих данных и предварительно обработал данные, сначала конвертировав каждый файл из .
Data Science
Обработка очень коротких и очень длинных последовательностей с помощью нейронной сети
00
Вопрос или проблема Я работаю над задачей многоклассовой классификации последовательностей. Мой набор данных состоит из последовательностей данных различной длины. Например, 1500 размеченных образцов: 500 точек данных принадлежат классу A, 500 классу B и 500 классу C.