Data Science
Запуск PCA на основе признаков tf-idf?
00
Вопрос или проблема Хорошая ли идея применять PCA к атрибутам, полученным с помощью Tf-Idf? Tf-idf возвращает много атрибутов, поэтому в этом случае я считаю, что применять PCA, чтобы уменьшить количество измерений, – хорошая идея.
Data Science
Какой алгоритм можно использовать для уменьшения размерности нескольких временных рядов?
00
Вопрос или проблема В моем наборе данных, точка данных по сути представляет собой временной ряд из 6 характеристик за год по месяцам, так что в итоге получается 6*12=72 характеристики. Мне нужно найти классовые выбросы, поэтому я выполняю сокращение размерности
Data Science
В чем разница между SMOTE до PCA и после PCA?
00
Вопрос или проблема Все мы знаем, что PCA (Анализ главных компонент) – это популярный статистический инструмент для уменьшения размерности в наборе данных. SMOTE (Метод синтетического увеличения выборки для меньшинства) позволяет генерировать данные
Data Science
Значимость признаков в алгоритме PCA + k-means
00
Вопрос или проблема Работая с набором данных Всемирного отчета о счастье, у меня есть N стран с M признаками и баллом счастья. Это параметр, по которому я выделил 3 класса: счастливые, средние, несчастные (числовые интервалы баллов счастья).
Data Science
Набор данных с чрезвычайно низкоразмерными изображениями для PCA
00
Вопрос или проблема Я ищу публичный набор данных изображений, которые отличаются друг от друга лишь незначительно, так что после применения PCA их можно будет реконструировать с небольшой ошибкой из очень небольшого количества коэффициентов PCA.
Data Science
Работа с наборами данных высокой размерности
00
Вопрос или проблема У меня есть данные размерности (25000, 100, 500), т.е. 25000 строк, каждая из которых состоит из двумерной матрицы 100 X 500. В данный момент я применяю только CNN для целей классификации. Есть ли другой способ, с помощью которого
Data Science
При визуализации узлов графа следует ли применять PCA к встраиванию node2vec?
00
Вопрос или проблема Я пытаюсь визуализировать узлы графа, используя встраивание node2vec. Встраивания node2vec имеют размерности от 50 до 100. У меня есть два плана: использовать umap для проекции встраиваний node2vec в 2D пространство использовать PCA
Data Science
Выход функции преобразования PCA из sklearn в Python не совпадает.
00
Вопрос или проблема Я вычисляю PCA по некоторым данным, используя 10 компонент и используя 3 из 10 следующим образом: transformer = PCA(n_components=10) trained=transformer.fit(train) one=numpy.matmul(train,numpy.transpose(trained.
Data Science
Реализация алгоритма PCA для восстановления данных (изображений)
00
Вопрос или проблема Я изучаю теорию и реализацию алгоритма главных компонент (PCA) в книге «Математика для машинного обучения» и заканчиваю официальный учебный ноутбук по адресу https://colab.research.google.com/github/mml-book/mml-book.
Data Science
лучшие алгоритмы для кластеризации клиентов, сегментация клиентов
00
Вопрос или проблема У меня есть набор данных, содержащий как категориальные, так и числовые переменные. Мне интересно, какие алгоритмы лучше всего подходят для кластеризации клиентов? Как найти скрытые паттерны, которые сегментируют клиента?