Data Science
Какой метод кластеризации мне использовать?
00
Вопрос или проблема Мои данные представляют собой группу из 10 тысяч точек (каждая имеет координаты узла (x, y)), которые распределены по плоскости. Они также имеют хроматическую окраску в зависимости от их веса. Мне нужно завершить метод байесовской
Data Science
Как уменьшить изменения положения после снижения размерности?
00
Вопрос или проблема Отказ от ответственности: Я начинающий в машинном обучении. Я работаю над визуализацией многомерных данных (текст как векторы tdidf) в 2D-пространство. Моя цель – маркировать/модифицировать эти точки данных и пересчитывать их
Data Science
Хорошо ли t-SNE справляется с кластеризацией экземпляров с одинаковым трендом?
00
Вопрос или проблема У меня есть набор данных временных рядов с 50 тысячами примеров и длиной 90, как показано на изображениях ниже: Мне интересно, смогут ли t-SNE или любой тип уменьшения размерности сгруппировать экземпляры, которые я показал выше, исходя из тренда, например.
Data Science
Как предварительно обрабатывать/кодировать категориальные данные для использования в алгоритмах снижения размерности и кластеризации?
00
Вопрос или проблема Я работаю над проектом, цель которого состоит в кластеризации участников опроса в зависимости от их ответов. Набор данных состоит из 63 вопросов, некоторые из которых номинальные, а некоторые – порядковые.
Data Science
Использование t-SNE поверх UMAP
00
Вопрос или проблема У меня есть проект для моей степени, в котором мне и моей команде нужно сгруппировать разные рецепты, и, используя chatGPT, мне было предложено использовать UMAP и уменьшить наши данные до 15-30 измерений, а затем использовать t-SNE
Data Science
Как мне рассчитать матрицу сходства с использованием ядра Стюдента-t?
00
Вопрос или проблема Как указано в заглавии, как мне рассчитать матрицу сходства с ненормализованным ядром Стюдента? Я пытаюсь рассчитать дивергенцию Кульбака-Лейблера для различных запусков t-SNE, но для этого мне нужна матрица Q.
Data Science
Какие самые быстрые методы уменьшения размерности можно использовать в готовом виде?
00
Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать движения в высокоразмерном, но разреженном векторном пространстве (например, вектор 1×75, где большинство элементов закодированы в формате one-hot или по модулю 3).