clustering - ответы на вопросы

Data Science

лучший алгоритм или модель для кластеризации областей на карте?

00

Вопрос или проблема У меня есть база данных, которая содержит информацию, такую как широта, долгота, а также другую информацию, например, достопримечательности, рестораны и торговые центры, сельская местность это или пригород, …

Data Science

Кластеризация с пользовательским критерием (минимальный вес кластера)

00

Вопрос или проблема Правка: в соответствии с комментарием от @anony-mousse, я изменяю вопрос, чтобы искать общий подход кластеризации, который соответствует этому критерию (минимальный вес на кластер). Мне нужно использовать метод кластеризации на наборе

Data Science

00

Вопрос или проблема Я пытаюсь создать систему, где пользователь приходит на платформу, выбирает тему (несколько заранее определенных тем), и тогда мы соединяем его с любым случайным пользователем онлайн, который выбрал ту же тему.

Программное обеспечение

00

Вопрос или проблема Я работаю над проектом больших данных и использую несколько старых серверов на базе различных операционных систем (Ubuntu, CentOS, Windows 2012, Windows 10). Одна из основных причин, по которой я бы хотел использовать распределенное

Data Science

Руководство по изучению анализа данных

00

Вопрос или проблема Я новичок в анализе данных, и мне нужно выполнить проект по анализу данных, используя методы кластеризации, для курса на R. Я понятия не имею, с чего начать и как выбрать набор данных. Я ищу какие-то ресурсы.

Data Science

Сегментация клиентов и ассоциация категорий

00

Вопрос или проблема Мне нужно решить два вопроса по следующему набору данных: 1. Разделить клиентов на взаимно исключающие группы. Объяснить кластеры. 2. Определить правила ассоциации 1-1 для каждой категории продукта в каждом кластере, то есть если клиент

Data Science

Как настраивать параметры пакет за пакетом?

00

Вопрос или проблема Как указано в заголовке, я пытаюсь кластеризовать огромный набор данных и делаю это с помощью sklearn.Birch, чтобы обучаться постепенно. Если бы это был небольшой набор данных, я мог бы просто использовать gridsearchcv.

Data Science

Кластеризация временных рядов на основе монотонного сходства

00

Вопрос или проблема Контекст Я занимаюсь задачей кластеризации 1500 временных рядов из 500 наблюдений в несколько кластеров. Временные ряды обладают одинаковыми наблюдаемыми свойствами в разных пространственных положениях, но реагируют на одни и те же экзогенные переменные.

Data Science

Вывод из текстовых данных без метки или цели.

00

Вопрос или проблема У меня есть кейс, в котором я имею текстовые данные, введенные утверждающим при утверждении некоторых кредитов. Мне нужно сделать некоторые выводы о возможных причинах для утверждения, используя NLP. Как мне к этому подойти?

Data Science

Какой метод кластеризации мне использовать?

00

Вопрос или проблема Мои данные представляют собой группу из 10 тысяч точек (каждая имеет координаты узла (x, y)), которые распределены по плоскости. Они также имеют хроматическую окраску в зависимости от их веса. Мне нужно завершить метод байесовской

Data Science

Каковы могут быть причины того, что 95% образцов принадлежат одному кластеру, когда есть 5 кластеров?

00

Вопрос или проблема ”’Я использовал алгоритм k-means для кластеризации набора документов, содержащих только текстовые данные. Документ содержит 2 миллиона записей. Удивительно, но результат кластеризации следующий: 90% записей хранится в одном

Data Science

Построение кластера геопространственных данных с увеличением в Python.

00

Вопрос или проблема Мне нужно построить интерактивный график кластеризации. В идеале, когда пользователь увеличивает масштаб, кластеры должны разбиваться на более мелкие кластеры на определенных уровнях масштабирования. Я планирую иметь несколько дискретных

Data Science

Обнаружение ссылок и цитат в документах

00

Вопрос или проблема Я ищу решение для обнаружения ссылок и цитат в документах. Например, ссылка выглядит как “[..] относится к разделу 3.1 документа XY“. Насколько я знаю, есть два подхода к решению этой задачи: –

Data Science

Объяснение сходств между экземплярами в кластере с использованием KMeans

00

Вопрос или проблема Если я создаю кластеры, используя алгоритм кластеризации KMeans в Python, есть ли способ узнать, какие атрибуты были использованы для группировки этих экземпляров в кластеры? Пример: у меня есть набор данных автомобилей с колонками 1 –

Data Science

Кластеризация временных рядов на данных о продажах — какие-нибудь идеи?

00

Вопрос или проблема У меня есть набор данных розничного магазина, и я интересуюсь проведением кластеризации временных рядов на этих данных. Какие идеи вы находите интересными для этой цели? На данный момент у меня есть: Какие тренды продаж существуют во времени?

Data Science

Как применить K-Medoids во многих CFG?

00

Вопрос или проблема У меня есть около 1000 DAG (ориентированных ациклических графов) различных файлов, показывающих использование java.io.BufferedReader. Следующее является представлением одного из графов digraph G { 9 [ label="9 : ROOT:setup()#0" ];

Data Science

Сравнение кластеризаций из разных наборов данных

00

Вопрос или проблема У меня есть 2 набора данных с по сути одинаковыми переменными, хотя один из них представляет данные за один год, а другой – за другой год. Я применил алгоритм KModes к обоим наборам данных и теперь имею некоторые кластеризации.

Data Science

Взвешенная кластеризация координат широты и долготы

00

Вопрос или проблема У меня есть миллионы точек с координатами широты и долготы, которые сгруппированы в квадраты. В некоторых квадратах находятся тысячи точек, в других – пара точек. Идея заключается в том, чтобы для каждого квадрата иметь один

Data Science

Как применить K-Medoids в PySpark?

00

Вопрос или проблема Библиотека pyspark ml не предоставляет методов кластеризации для K-Medoids. Поэтому мой вопрос: как можно применить K-Medoids в контексте pyspark? Существует кластеризация k-medoids для PySpark на spark-packages.

Data Science

Как кластеризовать на основе данных сенсоров? – Моя первая работа в области Data Science

00

Вопрос или проблема Я на своей первой (настоящей) работе в области данных и программирования. Как все могут себе представить, это может быть довольно сложно, и я много учусь, учитывая, что я студент по специальности «Наука о данных» в университете.