Data Science
Какова лучшая практика нормализации/стандартизации несбалансированных данных для обнаружения выбросов или задачи бинарной классификации?
00
Вопрос или проблема Я исследую обнаружение аномалий/выбросов/мошенничества и ищу лучшие практики предобработки синтетических данных для несбалансированных данных. Я проверил все методологии нормализации/стандартизации, которые не чувствительны к наличию
Data Science
Лучше ли обучать модель CNN на плохих изображениях или на хороших, если тестовые данные будут низкого качества?
00
Вопрос или проблема Это очень общий вопрос, поэтому давайте возьмем очень общий пример: представьте модель CNN, которая различает изображения лиц собак и кошек. У нас есть два типа обучающего набора данных: один с полными признаками и один с дефектными.
Data Science
Уровни доверия и уровни ошибок в моделях бинарной классификации
00
Вопрос или проблема Я начинающий самоучка в области машинного обучения, и в настоящее время я занимаюсь задачей бинарной классификации. Я создал бинарный классификатор на базе простой нейронной сети и провел несколько экспериментов с уровнем ошибок и
Data Science
Правильный способ сравнения результатов бинарных классификаторов с различной чувствительностью
00
Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.
Data Science
Бинарная классификация с использованием RNN не превышает 50% точности.
00
Вопрос или проблема Я пытаюсь выяснить причину, по которой моя сеть RNN не может превысить 50% для двоичной классификации. Мои входные данные имеют форму: X.shape - TensorShape([9585, 25, 2]) Мои метки представляют собой вектор с единым измерением с значениями 1.0 и 0.0: y - <
Data Science
точность и полнота равны нулю
00
Вопрос или проблема Почему моя модель показывает такие метрики? Во время тренировки у модели точность и полнота были равны нулю? Я пытаюсь сделать бинарную классификацию грибов [съедобные, ядовитые]. У меня есть модель CNN с некоторым дроп-аутом и батч-нормализацией.
Data Science
Почему у SVM хуже граница разделения, чем у логистической регрессии?
00
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.
Data Science
Гауссовский процесс бинарной классификации: почему все образцы латентной функции пересекают 0 в одном и том же месте?
00
Вопрос или проблема Я использую бинарный классификатор на основе гауссовского процесса на многомерном наборе данных с бинарными метками. Вероятность, как правило, монотонно увеличивается или уменьшается вдоль каждого признака/размерности.
Data Science
Граница решения нейронной сети
00
Вопрос или проблема Начнем с a). Для первого узла: 0 * x1 + 1 * x2 + 1 > 0 (0, потому что порог 0), что эквивалентно x2+1 > 0. Для второго узла: x1 * 1 + x2 * 0 + 1 > 0 (0, потому что порог 0), что эквивалентно x1 + 1 > […]
Data Science
Как заставить логистическую регрессию придавать некоторым наблюдениям большее значение/вес?
00
Вопрос или проблема У меня есть задача бинарной классификации с набором данных, состоящим из нескольких признаков. Когда я обучаю LogisticRegression на этом наборе данных, я получаю большое количество ложноположительных и ложноотрицательных результатов.
Data Science
Бинарная классификация на медицинском наборе данных (SVM)
00
Вопрос или проблема Я работаю над проектом, связанным с использованием моделей машинного обучения для классификации заданного медицинского датасета. Датасет, который вы можете найти здесь: https://zenodo.org/records/10885957, содержит данные о 10 000 пациентах.
Data Science
Классификация по данным о движении
00
Вопрос или проблема Сводка вопроса: Как можно выполнить задачу классификации индивидуумов по их данным о движении/позиции? У меня нет набора данных (в голове), но я буду делать вид, что он у меня есть, чтобы сделать мой вопрос немного более конкретным