Data Science
Какой является наилучшей техникой извлечения признаков для обнаружения новизны / аномалий в текстовом домене?
00
Вопрос или проблема Я работаю с системой классификации текста. Здесь мой набор данных содержит около 30 намерений. Но проблема в том, что у меня нет системы, разработанной для обработки входных данных, которые не попадают ни под одно из намерений.
Data Science
Инкрементальное обучение на автоэнкодере для обнаружения аномалий
00
Вопрос или проблема Я хочу поэтапно обучать свою предобученную модель автокодировщика на данных, которые поступают каждую минуту. Основываясь на этой теме, последовательные вызовы model.fit будут поэтапно обучать модель. Однако ошибка восстановления и
Data Science
как установить порог для обнаружения аномалий
00
Вопрос или проблема Я прочитал одну научную статью, и в ней говорилось, что они используют порог для обнаружения аномалий. Порог определяется для того, чтобы сделать некоторую пропорцию данных из валидационного набора помеченной как аномалии. Как этот концепт имеет смысл?
Data Science
Какова лучшая практика нормализации/стандартизации несбалансированных данных для обнаружения выбросов или задачи бинарной классификации?
00
Вопрос или проблема Я исследую обнаружение аномалий/выбросов/мошенничества и ищу лучшие практики предобработки синтетических данных для несбалансированных данных. Я проверил все методологии нормализации/стандартизации, которые не чувствительны к наличию
Data Science
Обнаружение аномалий/выбросов в реальном времени?
00
Вопрос или проблема Мои данные – это статистика использования/игры для игроков конкретной игры. Одна точка данных для пользователя – это агрегированная статистика за одну неделю. Цель заключается в следующем: обнаружить, когда аккаунт игрока
Data Science
Как выполнять обнаружение аномалий в GPS-данных на Python
00
Вопрос или проблема У меня есть набор данных в формате GPS: широта, долгота. Я хочу обнаружить аномалии с помощью Python. Я тестировал knn, smv, cof, iforest используя pycaret. Но у меня не получилось. Эти цвета аномальны, потому что угол изменения слишком
Data Science
Включает ли загрязнение превращение изолированного леса в контролируемый?
00
Вопрос или проблема В необучаемом обнаружении аномалий, превращает ли включение процента загрязнения изолирующий лес в обучаемый, а не необучаемый, когда я подгоняю данные после этого? Изолирующий лес является по сути необучаемым алгоритмом.
Data Science
Word2vec для кодирования медицинских процедур при использовании изолирующих лесов
00
Вопрос или проблема Я планирую использовать Isolation Forests в R (пакет solitude) для выявления выбросов в медицинских исках в моих данных. Каждая строка в моих данных представляет собой группу лекарств, которые каждый провайдер назначал за последние 12 месяцев.
Data Science
Обнаружение аномалий с использованием кластеризации высококоррелированных категориальных данных.
00
Вопрос или проблема У меня есть данные с двумя колонками, и обе они сильно коррелируют, например, если в колонке1 значение ABC, то колонка2 должно быть XYZ, т.е. ABC–>XYZ. Если в колонке2 будет что-то другое, это аномалия.
Data Science
Как удовлетворить концепцию масштабируемости с помощью алгоритмов DBSCAN и LOF
00
Вопрос или проблема Я предлагаю модель, которая сочетает в себе алгоритмы DBSCAN и LOF для обнаружения выбросов. Я хочу узнать, как удовлетворить концепции масштабируемости при выполнении этого метода с использованием наборов данных различного размера
Data Science
Временные ряды – Обнаружение аномалий
00
Вопрос или проблема У меня есть временные ряды с оповещениями (каждую минуту), в которых мне нужно найти аномалии. Я ищу библиотеку, которая может выполнять неконтролируемое обучение на этих данных и обнаруживать аномалии. Какая из библиотек Python будет лучшей для этой задачи?
Data Science
Назначьте оценку риска в записях в наборе данных.
00
Вопрос или проблема Мне стало интересно, могу ли я создать модель, которая будет присваивать оценку рисков записи, используя в качестве входных данных числовые и категориальные признаки, если у меня есть набор данных с категориальными и числовыми данными
Data Science
Примите любое предложение по созданию тренировочных данных из корреляционной матрицы, чтобы найти исключение и определить разницу в вариации.
00
Вопрос или проблема У меня есть N временных векторных признаков, полученных путём записи различных параметров с течением времени. Это приводит к матрице схожести размера N*N, которая содержит значения корреляции один к одному для каждого признака.
Data Science
Теория функции оценки изолированного леса
00
Вопрос или проблема В настоящее время я читаю эту статью о изоляционных лесах. В разделе о функции счета они упоминают следующее. Для справки, $h(x)$ определяется как длина пути точки данных, проходящей через iTree, а $n$ — это размер выборки, используемый для роста iTree.
Data Science
Метки как признаки в детекции аномалий
00
Вопрос или проблема У меня есть набор данных, созданный для решения задачи классификации. Из-за дисбаланса Y я решил перейти к задаче обнаружения аномалий. Должен ли я использовать Y, который у меня есть внутри модели обнаружения аномалий, в качестве признаков?
Data Science
обнаружение аномалий в данных датчиков автомобиля
00
Вопрос или проблема В настоящее время я углубляюсь в изучение аномалий в данных транспортных средств, генерируемых датчиками. Похоже, что нет подходящей книги или статьи, которые более детально охватывают эту тему. Надеюсь получить помощь в том, где и
Data Science
Как можно генерировать аномалии в наборе данных?
00
Вопрос или проблема Я создаю модель TensorFlow для выявления аномалий в данных смарт-метра электроэнергии и использую набор данных UK-DALE. Как я могу ввести аномалии в данные, чтобы протестировать модель? Аномалии обычно означают точки данных, которые
Data Science
Как задать пороговое значение, анализируя распределение потерь в задаче обнаружения аномалий
00
Вопрос или проблема Я следую этому руководству https://towardsdatascience.com/lstm-autoencoder-for-anomaly-detection-e1f4f2ee7ccf, чтобы использовать LSTM автокодировщик для обнаружения аномалий в моем несупервизируемом наборе данных.
Data Science
Обнаружение аномалий – связь между порогами и аномалиями
00
Вопрос или проблема Я разрабатываю программу для обнаружения аномалий на Python. Основная идея заключается в том, чтобы каждый день создавать новую модель LSTM, обучать ее на данных за предыдущие 7 дней и предсказывать следующий день.
Data Science
Сравнение подходов к детектированию аномалий во временных рядах
00
Вопрос или проблема После нескольких дней исследований, я смог получить общее представление о существующих методах выявления аномалий во временных рядах, а именно: Прогнозирование с использованием глубокого обучения. Например, RADM или модель LSTM Прогнозирование без глубокого обучения.