dimensionality-reduction
Data Science
Вопрос или проблема Для регрессионных задач с #Предикторами > #наблюдений я недавно читал о псевдообратной матрице Мура-Пенроуза, которая решает проблему невозвратимой матрицы в МНК для регрессионных задач. Насколько хорошо это “
Data Science
Вопрос или проблема У меня есть набор данных временных рядов с 50 тысячами примеров и длиной 90, как показано на изображениях ниже: Мне интересно, смогут ли t-SNE или любой тип уменьшения размерности сгруппировать экземпляры, которые я показал выше, исходя из тренда, например.
Data Science
Вопрос или проблема Это вопрос, который долго меня озадачивал. Я обученный статистик, и я знаю, что некоторые вещи невозможно сделать в высоких размерностях (или, по крайней мере, вы не получите то, что хотите, хотя можете получить что-то другое).
Data Science
Вопрос или проблема Итак, у меня есть набор данных с примерно 750 переменными (столбцами) и 50 000 строк записей. Я хотел бы уменьшить размерность набора данных до 25-50-100 размерностей и затем вычислить матрицу корреляции между этими размерностями.
Data Science
Вопрос или проблема В моем наборе данных, точка данных по сути представляет собой временной ряд из 6 характеристик за год по месяцам, так что в итоге получается 6*12=72 характеристики. Мне нужно найти классовые выбросы, поэтому я выполняю сокращение размерности
Data Science
Вопрос или проблема Насколько я знаю, Негативная матричная факторизация (NMF) — это процедура поиска матриц $A$ и $B$ такие, что $$Data_{ik} = \sum_j A_{ij} B_{jk}$$ Моя матрица данных на самом деле 3D. Я хотел бы подогнать к моим данным следующую модель
Data Science
Вопрос или проблема Я взял данные с здесь и хотел поиграть с многомерным шкалированием на этих данных. Данные выглядят следующим образом: В частности, я хочу отложить города в 2D-пространстве и посмотреть, насколько это соответствует их реальному расположению
Data Science
Вопрос или проблема Я работаю с смешанным набором данных, который соответствует данным о потреблении ТВ, с целью сократить количество признаков до только тех, которые имеют отношение к выявлению паттернов потребления ТВ (или групп потребления) с использованием кластеризации.
Data Science
Вопрос или проблема У меня есть данные размерности (25000, 100, 500), т.е. 25000 строк, каждая из которых состоит из двумерной матрицы 100 X 500. В данный момент я применяю только CNN для целей классификации. Есть ли другой способ, с помощью которого
Data Science
Вопрос или проблема Кратко: Вы можете предсказать что-то, но как объяснить предсказание? Редактирование: Я создал веб-сайт, который пытается ответить на этот вопрос с помощью внедрения / визуальной кластеризации данных в соответствии с путями, которые
Data Science
Вопрос или проблема Я работаю над проектом в области машинного обучения, где мы хотим визуализировать движения в высокоразмерном, но разреженном векторном пространстве (например, вектор 1×75, где большинство элементов закодированы в формате one-hot или по модулю 3).