Data Science
Питон: рассчитать взвешенный средний коэффициент корреляции
00
Вопрос или проблема Я рассчитываю волатильность (стандартное отклонение) доходности портфеля активов, используя подход с дисперсией и ковариацией. Коэффициенты корреляции и волатильности активов были оценены на основе исторической доходности.
Data Science
Корреляция с целевой переменной для регрессионной задачи
00
Вопрос или проблема Учитывая следующий датафрейм age job salary 0 1 Doctor 100 1 2 Engineer 200 2 3 Lawyer 300 ... с age как числовым, job как категориальным, я хочу протестировать корреляцию со зарплатой, с целью выбора признаков (возраст и/или работа)
Data Science
Как найти корреляции между данными во времени?
00
Вопрос или проблема У меня есть ежедневные данные о моих продажах и ежедневное обновление о том, как увеличиваются случаи COVID-19. Мои ежедневные продажи содержат информацию о моих клиентах и о моем продукте. Моя конечная цель –
Data Science
Проблемы с матрицей корреляции: Невозможно преобразовать переменные в числовые значения
00
Вопрос или проблема ВОПРОСЫ: Не могли бы вы сказать, как можно преобразовать переменные типа int и factor в числовые переменные в R? Не могли бы вы объяснить, почему as.numeric(as.character(df$Account_Global_Region_Cascading_Band)) не работает?
Data Science
Почему порядок колонок в CCA изменяет некоторые результаты?
00
Вопрос или проблема При запуске CCA из scikit learn, если изменить порядок в столбцах (изменение порядка строк обоих наборов данных вместе не дает разных результатов, которые я видел — не показано здесь), from sklearn.cross_decomposition import
Data Science
Снижение размерности для корреляции большого количества переменных
00
Вопрос или проблема Итак, у меня есть набор данных с примерно 750 переменными (столбцами) и 50 000 строк записей. Я хотел бы уменьшить размерность набора данных до 25-50-100 размерностей и затем вычислить матрицу корреляции между этими размерностями.
Data Science
Мера схожести смоделированных временных рядов и наблюдаемых временных рядов
00
Вопрос или проблема В моей работе у меня есть наблюдаемая временная серия и смоделированные. Я хочу сравнить кривые света и проверить на сходство, чтобы выяснить, какая смоделированная кривая лучше всего соответствует, и какие параметры лучше всего моделируют кривую света.
Data Science
Мне нужно определить, какой статистический тест и представление данных использовать.
00
Вопрос или проблема Если я хочу получить 2 пользователей для получения значений с помощью программного обеспечения. Эти числа соответствуют теме. Я хочу сравнить схожесть между числами, которые получает каждый пользователь для каждой темы.
Вопросы и ответы
Как увеличить график корреляции в corrplot?
00
Вопрос или проблема Я следовал приведенным ниже шагам, чтобы выполнить корреляцию. Это дало мне график без хорошей визуализации. Я также попробовал использовать png. library(corrplot) c_df <- Hmisc::rcorr(cor(df), type="spearman") M = c_df$r[1:3, 4:134] p.
Data Science
Как вычислить временно задержанную корреляцию между двумя переменными с множеством примеров в каждый момент времени t?
00
Вопрос или проблема У меня есть словарь следующей формы: datetimes = {год : {имя : (оценка1, оценка2)}} # есть 50+ имен/год Таким образом, по сути, я пытаюсь получить общее представление о том, как оценка1 в год_n коррелирует с оценкой2 в год_n.
Вопросы и ответы
Определение, существует ли конкретная ориентация между формами на изображении.
00
Вопрос или проблема нажмите для изображенияУ меня есть изображение конкретного материала, который растет в треугольной или кубической форме. На изображении, хотя ориентация каждой формы выглядит случайной, я хотел бы найти корреляцию или узнать, существует
Data Science
Обработка сдвига ковариат и многоколлинеарности в одном наборе данных
00
Вопрос или проблема Проблема связана с регрессионной задачей. Я получаю партии данных из источника эксперимента, который имеет примерно 3 тысячи столбцов. Однако я заметил, что почти 99% столбцов сильно коррелируют друг с другом.
Вопросы и ответы
Полифорическая корреляция и ДИ
00
Вопрос или проблема Я пытаюсь вычислить некоторые полихорические корреляции (воспроизводимый код здесь) library(polycor) Var1 <- (c(1,2,3,1,2,2,3,2,2,1,2)) Var2 <- (c(2,2,3,1,2,1,3,2,2,1,2)) df <- as.data.frame(cbind(Var1, Var2)) polychor(df$Var1,df$Var2)
Data Science
Изменения в стандартном графике тепловой карты – симметричные цвета столбцов, показывать только диагональные значения и имена столбцов на отметках осей x, y.
00
Вопрос или проблема У меня есть изображение тепловой карты (корреляция между всеми столбцами матрицы), и я не могу выполнить все изменения, указанные ниже, в одном и том же изображении: Цвета столбцов должны быть симметричны относительно нуля (например
Data Science
Почему существует высокая корреляция, даже если диаграмма рассеяния этого не показывает?
00
Вопрос или проблема Я не могу понять, почему коэффициент корреляции так высок (r=0.9244), даже если в структуре разброса нет линейной зависимости. Я вычислил его с помощью MATLAB: r = corrcoef(x, y); Как я могу это интерпретировать?
Data Science
Какой тест корреляции можно использовать для малых таблиц сопряженности?
00
Вопрос или проблема Мне нужно найти корреляцию между оценками, данными двумя сторонами. Допустим, у нас есть 2 тренера, а именно А и Б. Тренер А оценит навыки 12 игроков как “Сильный”, “Умеренный” или “
Data Science
Найдите корреляцию между двумя списками текстов.
00
Вопрос или проблема Допустим, у меня есть несколько списков текстов, такие как: A = ["девочка", "женщина", "королева"] B = ["мальчик", "мужчина", "король"] C = ["пожарный", "строительный рабочий", "механик"] D = ["медсестра", "учитель начальных классов"
Data Science
Рассчитайте корреляцию двух списков эмбеддингов.
00
Вопрос или проблема У меня есть два списка предложений A=["Astring1", "Astring2",...,"AstringN"] B=["Bstring1", "Bstring2",...,"BstringN"] Я использовал модель встраивания, такую как BERT, чтобы получить векторные представления всех моих строк в каждом
Data Science
Корреляция Пирсона с перекрывающимися данными
00
Вопрос или проблема У меня есть финансовый временной ряд, и я хочу вычислить корреляцию между прошлыми и будущими доходностями. Сначала я выбираю интервалы, скажем, l и h. Затем я вычисляю прошлые доходности, что равно текущему значению, деленному на
Data Science
Получите уравнение из зависимости между переменными.
00
Вопрос или проблема У меня есть аграрный набор данных о урожайности (в килограммах) при различных экологических условиях, таких как влажность, уровень осадков, солнечное освещение за несколько лет. Я хочу узнать, как связаны экологические факторы и урожайность.