Data Science
Хорошо ли t-SNE справляется с кластеризацией экземпляров с одинаковым трендом?
00
Вопрос или проблема У меня есть набор данных временных рядов с 50 тысячами примеров и длиной 90, как показано на изображениях ниже: Мне интересно, смогут ли t-SNE или любой тип уменьшения размерности сгруппировать экземпляры, которые я показал выше, исходя из тренда, например.
Data Science
Как предварительно обрабатывать/кодировать категориальные данные для использования в алгоритмах снижения размерности и кластеризации?
00
Вопрос или проблема Я работаю над проектом, цель которого состоит в кластеризации участников опроса в зависимости от их ответов. Набор данных состоит из 63 вопросов, некоторые из которых номинальные, а некоторые – порядковые.
Data Science
Использование t-SNE поверх UMAP
00
Вопрос или проблема У меня есть проект для моей степени, в котором мне и моей команде нужно сгруппировать разные рецепты, и, используя chatGPT, мне было предложено использовать UMAP и уменьшить наши данные до 15-30 измерений, а затем использовать t-SNE
Data Science
Как мне рассчитать матрицу сходства с использованием ядра Стюдента-t?
00
Вопрос или проблема Как указано в заглавии, как мне рассчитать матрицу сходства с ненормализованным ядром Стюдента? Я пытаюсь рассчитать дивергенцию Кульбака-Лейблера для различных запусков t-SNE, но для этого мне нужна матрица Q.
Data Science
Какие самые быстрые методы уменьшения размерности можно использовать в готовом виде?
00
Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать движения в высокоразмерном, но разреженном векторном пространстве (например, вектор 1×75, где большинство элементов закодированы в формате one-hot или по модулю 3).