Data Science
Агрегация низкоуровневых признаков для классификатора
00
Вопрос или проблема Цель заключается в прогнозировании отказа/неотказа маршрутизатора (1/0) в будущем временном окне с использованием всех данных, собранных за последний час (т.е. бинарная цель). Данные получаются на двух уровнях: Метрики маршрутизатора
Data Science
Как правильно реализовать случайную недовыборку во время кросс-валидации в Orange
00
Вопрос или проблема Я работаю над существенно несбалансированным набором данных для обнаружения мошенничества (класс 0: 284315 экземпляров, класс 1: 492 экземпляра) и пытаюсь правильно реализовать случайную недовыборку во время перекрестной проверки в Orange.
Data Science
Уделите больше внимания признакам, основываясь на графике распределения.
00
Вопрос или проблема У меня есть задача предсказать бинарную переменную purchase, их датасет сильно несбалансирован (10:100), и модели, которые я пробовал до сих пор (в основном ансамблевые), не справляются. Кроме того, я также пытался применить SMOTE
Data Science
Что означает взятие лапласиана у набора данных?
00
Вопрос или проблема Я использую небольшой набор данных для ML-проекта, который состоит примерно из 550 образцов. Я занимаюсь бинарной классификацией. Мне сказали взять лапласиан от набора данных, затем выполнить разложение на собственные значения и собственные векторы.
Data Science
Какие метрики classification_report лучше всего сообщать/интерпретировать для бинарной метки? Индивидуальные или макро средние для обоих классов? scikit-learn
00
Вопрос или проблема Во-первых, пожалуйста, простите мое невежество; я новичок, но готов учиться дальше. Пример: Я использую классификатор случайного леса для прогнозирования бинарного исхода. Бинарный исход равен 1, если люди в наборе данных когда-либо
Data Science
Использование метрики BinaryCrossentropy из Keras для бинарной модели
00
Вопрос или проблема Я пытаюсь реализовать модель бинарной классификации с использованием tensorflow keras и столкнулся с проблемой, которую не могу понять. Моя модель должна классифицировать изображения домов на два класса: “
Data Science
Потери становятся NaN через короткое время для классификации временных рядов.
00
Вопрос или проблема Вот мой модельный код для бинарной классификации временного ряда: def make_model(feature_columns): feature_layer = tf.keras.layers.DenseFeatures(feature_columns) feature_layer_outputs = feature_layer(feature_layer_inputs) feature_layer_outputs = tf.
Data Science
Поиск логистической потери/отрицательного логарифмического правдоподобия – классификация бинарной логистической регрессией
00
Вопрос или проблема Я новичок в машинном обучении и науке о данных, и у меня возникают трудности с простой задачей. В моей задаче мне дана серия данных $X_i$, где $X_i = (x_{i1}, x_{i2})$, и у каждой точки данных есть метка $y_i$, где $y_i \in [-1, 1]$.
Data Science
Классификация текста неверно классифицирует?
00
Вопрос или проблема Я пытаюсь решить задачу бинарной классификации. Мои метки — абьюзивные (1) и не абьюзивные (0). Мой набор данных был несбалансирован (больше 1, чем 0), и я использовал увеличенное количество выборок для меньшинства (т.
Data Science
Форма входного тензора для бинарной классификации временных рядов с использованием CNN
00
Вопрос или проблема Я хочу предсказать, выйдет ли машина из строя на основе самой последней серии измерений, полученных с помощью бортовых датчиков. У меня есть несколько десятков машин, каждая из которых имеет датчик, который делает измерение через равные интервалы.
Data Science
Какова лучшая практика нормализации/стандартизации несбалансированных данных для обнаружения выбросов или задачи бинарной классификации?
00
Вопрос или проблема Я исследую обнаружение аномалий/выбросов/мошенничества и ищу лучшие практики предобработки синтетических данных для несбалансированных данных. Я проверил все методологии нормализации/стандартизации, которые не чувствительны к наличию
Data Science
Лучше ли обучать модель CNN на плохих изображениях или на хороших, если тестовые данные будут низкого качества?
00
Вопрос или проблема Это очень общий вопрос, поэтому давайте возьмем очень общий пример: представьте модель CNN, которая различает изображения лиц собак и кошек. У нас есть два типа обучающего набора данных: один с полными признаками и один с дефектными.
Data Science
Уровни доверия и уровни ошибок в моделях бинарной классификации
00
Вопрос или проблема Я начинающий самоучка в области машинного обучения, и в настоящее время я занимаюсь задачей бинарной классификации. Я создал бинарный классификатор на базе простой нейронной сети и провел несколько экспериментов с уровнем ошибок и
Data Science
Правильный способ сравнения результатов бинарных классификаторов с различной чувствительностью
00
Вопрос или проблема Я сравниваю 5 сторонних классификационных моделей на подмножестве результатов (в частности, ложно положительных, которые я исследую, чтобы найти общую причину). Все пять моделей выдают значения от 0 до 1, но, похоже, имеют разную общую чувствительность.
Data Science
Бинарная классификация с использованием RNN не превышает 50% точности.
00
Вопрос или проблема Я пытаюсь выяснить причину, по которой моя сеть RNN не может превысить 50% для двоичной классификации. Мои входные данные имеют форму: X.shape - TensorShape([9585, 25, 2]) Мои метки представляют собой вектор с единым измерением с значениями 1.0 и 0.0: y - <
Data Science
точность и полнота равны нулю
00
Вопрос или проблема Почему моя модель показывает такие метрики? Во время тренировки у модели точность и полнота были равны нулю? Я пытаюсь сделать бинарную классификацию грибов [съедобные, ядовитые]. У меня есть модель CNN с некоторым дроп-аутом и батч-нормализацией.
Data Science
Почему у SVM хуже граница разделения, чем у логистической регрессии?
00
Вопрос или проблема Я использовал как SVM с полиномиальным ядром степени 3, так и логистическую регрессию с преобразованными признаками с помощью PolynomialFeatures с той же степенью 3 на стандартном наборе данных Moons от scikit-learn.
Data Science
Гауссовский процесс бинарной классификации: почему все образцы латентной функции пересекают 0 в одном и том же месте?
00
Вопрос или проблема Я использую бинарный классификатор на основе гауссовского процесса на многомерном наборе данных с бинарными метками. Вероятность, как правило, монотонно увеличивается или уменьшается вдоль каждого признака/размерности.
Data Science
Граница решения нейронной сети
00
Вопрос или проблема Начнем с a). Для первого узла: 0 * x1 + 1 * x2 + 1 > 0 (0, потому что порог 0), что эквивалентно x2+1 > 0. Для второго узла: x1 * 1 + x2 * 0 + 1 > 0 (0, потому что порог 0), что эквивалентно x1 + 1 > […]
Data Science
Как заставить логистическую регрессию придавать некоторым наблюдениям большее значение/вес?
00
Вопрос или проблема У меня есть задача бинарной классификации с набором данных, состоящим из нескольких признаков. Когда я обучаю LogisticRegression на этом наборе данных, я получаю большое количество ложноположительных и ложноотрицательных результатов.