anomaly-detection
Data Science
Вопрос или проблема Я работаю с системой классификации текста. Здесь мой набор данных содержит около 30 намерений. Но проблема в том, что у меня нет системы, разработанной для обработки входных данных, которые не попадают ни под одно из намерений.
Data Science
Вопрос или проблема Я хочу поэтапно обучать свою предобученную модель автокодировщика на данных, которые поступают каждую минуту. Основываясь на этой теме, последовательные вызовы model.fit будут поэтапно обучать модель. Однако ошибка восстановления и
Data Science
Вопрос или проблема Я прочитал одну научную статью, и в ней говорилось, что они используют порог для обнаружения аномалий. Порог определяется для того, чтобы сделать некоторую пропорцию данных из валидационного набора помеченной как аномалии. Как этот концепт имеет смысл?
Data Science
Вопрос или проблема Я исследую обнаружение аномалий/выбросов/мошенничества и ищу лучшие практики предобработки синтетических данных для несбалансированных данных. Я проверил все методологии нормализации/стандартизации, которые не чувствительны к наличию
Data Science
Вопрос или проблема Мои данные – это статистика использования/игры для игроков конкретной игры. Одна точка данных для пользователя – это агрегированная статистика за одну неделю. Цель заключается в следующем: обнаружить, когда аккаунт игрока
Data Science
Вопрос или проблема У меня есть набор данных в формате GPS: широта, долгота. Я хочу обнаружить аномалии с помощью Python. Я тестировал knn, smv, cof, iforest используя pycaret. Но у меня не получилось. Эти цвета аномальны, потому что угол изменения слишком
Data Science
Вопрос или проблема В необучаемом обнаружении аномалий, превращает ли включение процента загрязнения изолирующий лес в обучаемый, а не необучаемый, когда я подгоняю данные после этого? Изолирующий лес является по сути необучаемым алгоритмом.
Data Science
Вопрос или проблема Я планирую использовать Isolation Forests в R (пакет solitude) для выявления выбросов в медицинских исках в моих данных. Каждая строка в моих данных представляет собой группу лекарств, которые каждый провайдер назначал за последние 12 месяцев.
Data Science
Вопрос или проблема У меня есть данные с двумя колонками, и обе они сильно коррелируют, например, если в колонке1 значение ABC, то колонка2 должно быть XYZ, т.е. ABC–>XYZ. Если в колонке2 будет что-то другое, это аномалия.
Data Science
Вопрос или проблема Я предлагаю модель, которая сочетает в себе алгоритмы DBSCAN и LOF для обнаружения выбросов. Я хочу узнать, как удовлетворить концепции масштабируемости при выполнении этого метода с использованием наборов данных различного размера
Data Science
Вопрос или проблема У меня есть временные ряды с оповещениями (каждую минуту), в которых мне нужно найти аномалии. Я ищу библиотеку, которая может выполнять неконтролируемое обучение на этих данных и обнаруживать аномалии. Какая из библиотек Python будет лучшей для этой задачи?
Data Science
Вопрос или проблема Мне стало интересно, могу ли я создать модель, которая будет присваивать оценку рисков записи, используя в качестве входных данных числовые и категориальные признаки, если у меня есть набор данных с категориальными и числовыми данными
Data Science
Вопрос или проблема У меня есть N временных векторных признаков, полученных путём записи различных параметров с течением времени. Это приводит к матрице схожести размера N*N, которая содержит значения корреляции один к одному для каждого признака.
Data Science
Вопрос или проблема В настоящее время я читаю эту статью о изоляционных лесах. В разделе о функции счета они упоминают следующее. Для справки, $h(x)$ определяется как длина пути точки данных, проходящей через iTree, а $n$ — это размер выборки, используемый для роста iTree.
Data Science
Вопрос или проблема У меня есть набор данных, созданный для решения задачи классификации. Из-за дисбаланса Y я решил перейти к задаче обнаружения аномалий. Должен ли я использовать Y, который у меня есть внутри модели обнаружения аномалий, в качестве признаков?
Data Science
Вопрос или проблема В настоящее время я углубляюсь в изучение аномалий в данных транспортных средств, генерируемых датчиками. Похоже, что нет подходящей книги или статьи, которые более детально охватывают эту тему. Надеюсь получить помощь в том, где и
Data Science
Вопрос или проблема Я создаю модель TensorFlow для выявления аномалий в данных смарт-метра электроэнергии и использую набор данных UK-DALE. Как я могу ввести аномалии в данные, чтобы протестировать модель? Аномалии обычно означают точки данных, которые
Data Science
Вопрос или проблема Я следую этому руководству https://towardsdatascience.com/lstm-autoencoder-for-anomaly-detection-e1f4f2ee7ccf, чтобы использовать LSTM автокодировщик для обнаружения аномалий в моем несупервизируемом наборе данных.
Data Science
Вопрос или проблема Я разрабатываю программу для обнаружения аномалий на Python. Основная идея заключается в том, чтобы каждый день создавать новую модель LSTM, обучать ее на данных за предыдущие 7 дней и предсказывать следующий день.
Data Science
Вопрос или проблема После нескольких дней исследований, я смог получить общее представление о существующих методах выявления аномалий во временных рядах, а именно: Прогнозирование с использованием глубокого обучения. Например, RADM или модель LSTM Прогнозирование без глубокого обучения.