Data Science
Безопасно ли использовать метки, созданные с помощью модели без учителя, для обучения модели с учителем, используя те же данные?
00
Вопрос или проблема У меня есть набор данных, в котором я должен обнаружить аномалии. Сейчас я использую подмножество данных (назовем это подмножество A) и применяю алгоритм DBSCAN для обнаружения аномалий в наборе A. Как только аномалии обнаружены, используя
Data Science
Является ли HDBSCAN агломеративной иерархической кластеризацией?
00
Вопрос или проблема Я смотрю на HDBSCAN и задаюсь вопросом, является ли он делительным или агломеративным? Я понимаю оба подхода, но не понимаю, какой из них использует HDBSCAN. Ищу пояснения. Ответ дан в Пропозиции 1 в статье по HDBSCAN 1.
Data Science
1D ‘Кластеризация’
00
Вопрос или проблема Я работаю над исследовательской работой о надежной схеме агрегации федеративного обучения для защиты от атакующих. У меня есть 1D массив оценок доверия для клиентов, и мне нужно сгруппировать их, чтобы выявить честных клиентов (с наивысшими оценками).
Data Science
Объяснение цикла for в демонстрации алгоритма DBSCAN
00
Вопрос или проблема Что происходит с данными в нижнем цикле for в следующем коде алгоритма DBSCAN и почему? # Генерация выборочных данных import numpy as np from sklearn.cluster import DBSCAN from sklearn import metrics from sklearn.
Data Science
Сгруппировка событий в последовательности
00
Вопрос или проблема У меня есть последовательность повторяющихся событий, которые я хотел бы сгруппировать для представления различных операционных активностей основного процесса. Эти события могут происходить в определенном порядке или нет.
Data Science
Как удовлетворить концепцию масштабируемости с помощью алгоритмов DBSCAN и LOF
00
Вопрос или проблема Я предлагаю модель, которая сочетает в себе алгоритмы DBSCAN и LOF для обнаружения выбросов. Я хочу узнать, как удовлетворить концепции масштабируемости при выполнении этого метода с использованием наборов данных различного размера
Data Science
Кластеризация DBSCAN с использованием алгоритма классификации внутри каждого образованного кластера.
00
Вопрос или проблема Я использую алгоритм DBSCAN на данных “диабет индийцев пима”, но не могу правильно кластеризовать данные. Также я хочу использовать алгоритм классификации в каждом кластере и сравнить точность каждого кластера и предсказать большинство.
Data Science
Типы искусственных аномалий
00
Вопрос или проблема Я работаю над некоторыми алгоритмами для обнаружения аномалий. Набор данных чистый от аномалий, поэтому я хочу добавить несколько искусственных аномалий. Я добавил некоторые аномалии. Я получаю максимальное значение в наборе данных