correlation
Data Science
Вопрос или проблема Дан тензор третьего ранга с размерами $x,y,z$. Где: $x$: количество графов (количество выборок) $y$: количество узлов/векторов/признаков (скажем, $5$: $a, b, c, d,$ и $e$) $z$: размерность вложения (например, $2$ для декартовой плоскости
Data Science
Вопрос или проблема Я хочу создать модель классификации, и для этого в конце моего предобработки и создания признаков я получаю 167 непрерывных признаков и дискретную цель (5 модальностей). Я хотел бы уменьшить количество признаков, так как оно кажется слишком большим.
Data Science
Вопрос или проблема Мне действительно нужна помощь с GAM. Я должен выяснить, является ли ассоциация линейной или нелинейной с помощью GAM. Переменная предиктор — это температура на лаге 0, а результат — сердечно-сосудистые госпитализации (переменная подсчета).
Data Science
Вопрос или проблема Я ищу решение для проведения модифицированного t-теста или любую другую возможность, чтобы вычислить значимые или незначимые отношения в пространственных данных (которые могут быть стопкой растров или большим списком (не)регулярных
Data Science
Вопрос или проблема Я новичок в области data science и хотел бы узнать, существуют ли инструменты, которые могут определить взаимосвязи между переменными, которые могут быть релевантны для решения проблемы. Представьте, что у меня есть файл журнала, который
Data Science
Вопрос или проблема Даны списки $L_1, \dots, L_n$ с, скажем, 2000 значениями каждый, и произвольные числа $c_1, \dots, c_n$. Можно ли сгенерировать случайный список из 2000 значений, который имеет корреляцию $c_i$ с $L_i$ для всех $i$?
Data Science
Вопрос или проблема Я строю 3 модели нейронных сетей на наборе данных, который уже разделен на обучающую и тестовую выборки. В ходе анализа я обнаружил, что этот набор данных содержит значения в тестовом наборе, которые не существуют в обучающем наборе.
Data Science
Вопрос или проблема Я работаю над задачей прогнозирования фондового рынка на основе LSTM и пытаюсь найти способ выбора входных переменных. При расчете корреляции между переменными (например, цена закрытия акций Tesla против цены закрытия акций Microsoft)
Data Science
Вопрос или проблема Для задачи множественной линейной регрессии у меня есть как категориальные, так и числовые переменные в данных. Я проверяю корреляцию для числовых переменных для EDA и стандартизирую их, взяв логарифм. Остальные столбцы категориальных
Data Science
Вопрос или проблема Какое значение имеет взвешенная сумма группы переменных, так чтобы каждое значение веса было назначено для максимизации минимальной корреляции всех этих переменных с полученной суммой? Эта техника применяется, когда задача заключается
Data Science
Вопрос или проблема Моя цель – определить наименее затронутые и наиболее пострадавшие от COVID-19 отрасли с точки зрения безработицы. Что касается данных, которые я буду использовать для этой задачи, у меня есть временной ряд данных о безработице
Data Science
Вопрос или проблема У меня есть набор данных, который собирает ежедневные данные на основе транзакций между двумя субъектами. Я хочу выяснить силу, направление и вид отношения между двумя непрерывными переменными, т.е. количеством транзакций (No_of_transactions)
Data Science
Вопрос или проблема У меня есть большой датафрейм с почти миллионом строк и 2000 столбцов. Я пытаюсь сделать отбор признаков, используя корреляцию между переменными. Проблема в том, что для набора из n признаков нам нужна корреляция между nC2 или n*(n-1)/2
Data Science
Вопрос или проблема У меня есть таблица данных о ежедневных значениях за последние 2 года, которая выглядит следующим образом, и мне нужно рассчитать корреляции между данными в Python. У меня нет опыта в области науки о данных, поэтому я боюсь, что мои
Data Science
Вопрос или проблема Когда я пытаюсь выполнить sns.heatmap(df.corr(),annot=True) этот код в своем Jupyter ноутбуке, возникает эта ошибка. Я не понимаю, в чем проблема. Пожалуйста, помогите мне. Для df.corr() вам нужно передать значения типа float/целое число вместо строки.
Data Science
Вопрос или проблема У меня есть набор из двух данных с коэффициентом 0.85. Как я могу вычислить коэффициент для каждого отдельного набора данных? Например, один набор — 0-200 (x), а другой — 0-$500,000 (y). Как я могу получить коэффициент для одной точки данных?
Data Science
Вопрос или проблема Коррелированные и некоррелированные термины часто используются в области науки о данных и рассматриваются как если бы они представляли коэффициент корреляции. Это правильный подход? Да! Корреляция между признаками/атрибутами действительно
Data Science
Вопрос или проблема Я работаю над выбором наиболее эффективных признаков из набора данных с более чем 2000 признаками. Я использую для этого разные алгоритмы (selectKBest с хи-квадратом, Extra Trees, Корреляция и т.д.). Но когда я смотрю на рейтинг признаков
Data Science
Вопрос или проблема Я рассчитываю волатильность (стандартное отклонение) доходности портфеля активов, используя подход с дисперсией и ковариацией. Коэффициенты корреляции и волатильности активов были оценены на основе исторической доходности.
Data Science
Вопрос или проблема Учитывая следующий датафрейм age job salary 0 1 Doctor 100 1 2 Engineer 200 2 3 Lawyer 300 ... с age как числовым, job как категориальным, я хочу протестировать корреляцию со зарплатой, с целью выбора признаков (возраст и/или работа)