Data Science
Набор данных с чрезвычайно низкоразмерными изображениями для PCA
00
Вопрос или проблема Я ищу публичный набор данных изображений, которые отличаются друг от друга лишь незначительно, так что после применения PCA их можно будет реконструировать с небольшой ошибкой из очень небольшого количества коэффициентов PCA.
Data Science
Работа с наборами данных высокой размерности
00
Вопрос или проблема У меня есть данные размерности (25000, 100, 500), т.е. 25000 строк, каждая из которых состоит из двумерной матрицы 100 X 500. В данный момент я применяю только CNN для целей классификации. Есть ли другой способ, с помощью которого
Data Science
При визуализации узлов графа следует ли применять PCA к встраиванию node2vec?
00
Вопрос или проблема Я пытаюсь визуализировать узлы графа, используя встраивание node2vec. Встраивания node2vec имеют размерности от 50 до 100. У меня есть два плана: использовать umap для проекции встраиваний node2vec в 2D пространство использовать PCA
Data Science
Выход функции преобразования PCA из sklearn в Python не совпадает.
00
Вопрос или проблема Я вычисляю PCA по некоторым данным, используя 10 компонент и используя 3 из 10 следующим образом: transformer = PCA(n_components=10) trained=transformer.fit(train) one=numpy.matmul(train,numpy.transpose(trained.
Data Science
Реализация алгоритма PCA для восстановления данных (изображений)
00
Вопрос или проблема Я изучаю теорию и реализацию алгоритма главных компонент (PCA) в книге «Математика для машинного обучения» и заканчиваю официальный учебный ноутбук по адресу https://colab.research.google.com/github/mml-book/mml-book.
Data Science
лучшие алгоритмы для кластеризации клиентов, сегментация клиентов
00
Вопрос или проблема У меня есть набор данных, содержащий как категориальные, так и числовые переменные. Мне интересно, какие алгоритмы лучше всего подходят для кластеризации клиентов? Как найти скрытые паттерны, которые сегментируют клиента?