dbscan - ответы на вопросы

Data Science

Подходят ли мои данные для кластеризации с использованием DBSCAN?

01

Вопрос или проблема У меня есть определенный набор данных, состоящий из 50 тыс. элементов, каждый с 40 характеристиками. Я хочу попробовать кластеризовать данные в их исходном виде, без сокращения размерности. Основной алгоритм, который я рассматриваю

Data Science

Безопасно ли использовать метки, созданные с помощью модели без учителя, для обучения модели с учителем, используя те же данные?

00

Вопрос или проблема У меня есть набор данных, в котором я должен обнаружить аномалии. Сейчас я использую подмножество данных (назовем это подмножество A) и применяю алгоритм DBSCAN для обнаружения аномалий в наборе A. Как только аномалии обнаружены, используя

Data Science

Является ли HDBSCAN агломеративной иерархической кластеризацией?

00

Вопрос или проблема Я смотрю на HDBSCAN и задаюсь вопросом, является ли он делительным или агломеративным? Я понимаю оба подхода, но не понимаю, какой из них использует HDBSCAN. Ищу пояснения. Ответ дан в Пропозиции 1 в статье по HDBSCAN 1.

Data Science

1D ‘Кластеризация’

00

Вопрос или проблема Я работаю над исследовательской работой о надежной схеме агрегации федеративного обучения для защиты от атакующих. У меня есть 1D массив оценок доверия для клиентов, и мне нужно сгруппировать их, чтобы выявить честных клиентов (с наивысшими оценками).

Data Science

Объяснение цикла for в демонстрации алгоритма DBSCAN

00

Вопрос или проблема Что происходит с данными в нижнем цикле for в следующем коде алгоритма DBSCAN и почему? # Генерация выборочных данных import numpy as np from sklearn.cluster import DBSCAN from sklearn import metrics from sklearn.

Data Science

Сгруппировка событий в последовательности

00

Вопрос или проблема У меня есть последовательность повторяющихся событий, которые я хотел бы сгруппировать для представления различных операционных активностей основного процесса. Эти события могут происходить в определенном порядке или нет.

Data Science

Как удовлетворить концепцию масштабируемости с помощью алгоритмов DBSCAN и LOF

00

Вопрос или проблема Я предлагаю модель, которая сочетает в себе алгоритмы DBSCAN и LOF для обнаружения выбросов. Я хочу узнать, как удовлетворить концепции масштабируемости при выполнении этого метода с использованием наборов данных различного размера

Data Science

Кластеризация DBSCAN с использованием алгоритма классификации внутри каждого образованного кластера.

00

Вопрос или проблема Я использую алгоритм DBSCAN на данных “диабет индийцев пима”, но не могу правильно кластеризовать данные. Также я хочу использовать алгоритм классификации в каждом кластере и сравнить точность каждого кластера и предсказать большинство.

Data Science

Типы искусственных аномалий

00

Вопрос или проблема Я работаю над некоторыми алгоритмами для обнаружения аномалий. Набор данных чистый от аномалий, поэтому я хочу добавить несколько искусственных аномалий. Я добавил некоторые аномалии. Я получаю максимальное значение в наборе данных