binary-classification - ответы на вопросы

Data Science

Агрегация низкоуровневых признаков для классификатора

00

Вопрос или проблема Цель заключается в прогнозировании отказа/неотказа маршрутизатора (1/0) в будущем временном окне с использованием всех данных, собранных за последний час (т.е. бинарная цель). Данные получаются на двух уровнях: Метрики маршрутизатора

Data Science

Как правильно реализовать случайную недовыборку во время кросс-валидации в Orange

00

Вопрос или проблема Я работаю над существенно несбалансированным набором данных для обнаружения мошенничества (класс 0: 284315 экземпляров, класс 1: 492 экземпляра) и пытаюсь правильно реализовать случайную недовыборку во время перекрестной проверки в Orange.

Data Science

Уделите больше внимания признакам, основываясь на графике распределения.

00

Вопрос или проблема У меня есть задача предсказать бинарную переменную purchase, их датасет сильно несбалансирован (10:100), и модели, которые я пробовал до сих пор (в основном ансамблевые), не справляются. Кроме того, я также пытался применить SMOTE

Data Science

Что означает взятие лапласиана у набора данных?

00

Вопрос или проблема Я использую небольшой набор данных для ML-проекта, который состоит примерно из 550 образцов. Я занимаюсь бинарной классификацией. Мне сказали взять лапласиан от набора данных, затем выполнить разложение на собственные значения и собственные векторы.

Data Science

Какие метрики classification_report лучше всего сообщать/интерпретировать для бинарной метки? Индивидуальные или макро средние для обоих классов? scikit-learn

00

Вопрос или проблема Во-первых, пожалуйста, простите мое невежество; я новичок, но готов учиться дальше. Пример: Я использую классификатор случайного леса для прогнозирования бинарного исхода. Бинарный исход равен 1, если люди в наборе данных когда-либо

Data Science

Использование метрики BinaryCrossentropy из Keras для бинарной модели

00

Вопрос или проблема Я пытаюсь реализовать модель бинарной классификации с использованием tensorflow keras и столкнулся с проблемой, которую не могу понять. Моя модель должна классифицировать изображения домов на два класса: “

Data Science

Потери становятся NaN через короткое время для классификации временных рядов.

00

Вопрос или проблема Вот мой модельный код для бинарной классификации временного ряда: def make_model(feature_columns): feature_layer = tf.keras.layers.DenseFeatures(feature_columns) feature_layer_outputs = feature_layer(feature_layer_inputs) feature_layer_outputs = tf.

Data Science

Поиск логистической потери/отрицательного логарифмического правдоподобия – классификация бинарной логистической регрессией

00

Вопрос или проблема Я новичок в машинном обучении и науке о данных, и у меня возникают трудности с простой задачей. В моей задаче мне дана серия данных $X_i$, где $X_i = (x_{i1}, x_{i2})$, и у каждой точки данных есть метка $y_i$, где $y_i \in [-1, 1]$.

Data Science

Классификация текста неверно классифицирует?

00

Вопрос или проблема Я пытаюсь решить задачу бинарной классификации. Мои метки — абьюзивные (1) и не абьюзивные (0). Мой набор данных был несбалансирован (больше 1, чем 0), и я использовал увеличенное количество выборок для меньшинства (т.

Data Science

Форма входного тензора для бинарной классификации временных рядов с использованием CNN

00

Вопрос или проблема Я хочу предсказать, выйдет ли машина из строя на основе самой последней серии измерений, полученных с помощью бортовых датчиков. У меня есть несколько десятков машин, каждая из которых имеет датчик, который делает измерение через равные интервалы.

Data Science

Какова лучшая практика нормализации/стандартизации несбалансированных данных для обнаружения выбросов или задачи бинарной классификации?

00

Вопрос или проблема Я исследую обнаружение аномалий/выбросов/мошенничества и ищу лучшие практики предобработки синтетических данных для несбалансированных данных. Я проверил все методологии нормализации/стандартизации, которые не чувствительны к наличию

Data Science

Лучше ли обучать модель CNN на плохих изображениях или на хороших, если тестовые данные будут низкого качества?

00

Вопрос или проблема Это очень общий вопрос, поэтому давайте возьмем очень общий пример: представьте модель CNN, которая различает изображения лиц собак и кошек. У нас есть два типа обучающего набора данных: один с полными признаками и один с дефектными.

Data Science

Уровни доверия и уровни ошибок в моделях бинарной классификации

00

Вопрос или проблема Я начинающий самоучка в области машинного обучения, и в настоящее время я занимаюсь задачей бинарной классификации. Я создал бинарный классификатор на базе простой нейронной сети и провел несколько экспериментов с уровнем ошибок и

Data Science

Правильный способ сравнения результатов бинарных классификаторов с различной чувствительностью

00

Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.

Data Science

Бинарная классификация с использованием RNN не превышает 50% точности.

00

Вопрос или проблема Я пытаюсь выяснить причину, по которой моя сеть RNN не может превысить 50% для двоичной классификации. Мои входные данные имеют форму: X.shape - TensorShape([9585, 25, 2]) Мои метки представляют собой вектор с единым измерением с значениями 1.0 и 0.0: y - <

Data Science

точность и полнота равны нулю

00

Вопрос или проблема Почему моя модель показывает такие метрики? Во время тренировки у модели точность и полнота были равны нулю? Я пытаюсь сделать бинарную классификацию грибов [съедобные, ядовитые]. У меня есть модель CNN с некоторым дроп-аутом и батч-нормализацией.

Data Science

Почему у SVM хуже граница разделения, чем у логистической регрессии?

00

Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.

Data Science

Гауссовский процесс бинарной классификации: почему все образцы латентной функции пересекают 0 в одном и том же месте?

00

Вопрос или проблема Я использую бинарный классификатор на основе гауссовского процесса на многомерном наборе данных с бинарными метками. Вероятность, как правило, монотонно увеличивается или уменьшается вдоль каждого признака/размерности.

Data Science

Граница решения нейронной сети

00

Вопрос или проблема Начнем с a). Для первого узла: 0 * x1 + 1 * x2 + 1 > 0 (0, потому что порог 0), что эквивалентно x2+1 > 0. Для второго узла: x1 * 1 + x2 * 0 + 1 > 0 (0, потому что порог 0), что эквивалентно x1 + 1 > […]

Data Science

Как заставить логистическую регрессию придавать некоторым наблюдениям большее значение/вес?

00

Вопрос или проблема У меня есть задача бинарной классификации с набором данных, состоящим из нескольких признаков. Когда я обучаю LogisticRegression на этом наборе данных, я получаю большое количество ложноположительных и ложноотрицательных результатов.