Вопрос или проблема
Дано: у меня есть столбцы, похожие на
| Местоположение | Год | A | B |
|----------------|-----|---|-----|
| Дели | 1980 | 4 | 3.4 |
| Мумбаи | 1986 | 3 | 3.9 |
| Дели | 1990 | 5 | 4.4 |
| Бангалор | 1997 | 2 | 2.6 |
| Дели | 1998 | 4 | 3.8 |
| Дели | 1991 | 4 | 4.5 |
| Бангалор | 1987 | 4 | 3.8 |
| Мумбаи | 1998 | 5 | 4.8 |
И я хочу вычислить корреляцию между столбцами A
и B
в категории местоположения Дели.
Я хочу выполнить корреляцию только для Дели как Местоположение
| Местоположение | A | B |
|----------------|---|-----|
| Дели | 4 | 3.4 |
| Дели | 5 | 4.4 |
| Дели | 4 | 3.8 |
| Дели | 4 | 4.5 |
Я пытался использовать функцию CORREL()
, но она вычисляет корреляцию A
и B
для всех местоположений. Мне нужно вычислить корреляцию только для выбранного Местоположения
.
Решение заключается в простом фильтровании с помощью формулы массива. Делая каждую область корреляции зависимой от того, является ли A2:A9 «Дели», вы создаете условную корреляцию.
=CORREL(IF(A2:A9="Delhi", C2:C9), IF(A2:A9="Delhi", D2:D9))
Это формула массивного стиля. Таким образом, необходимо завершать формулу с помощью Ctrl+Shift+Enter; а не просто Enter. Если вы сделаете это правильно, Excel обернет формулу в фигурные скобки; например, { и }.
Используя этот метод, ответ на ваши данные равен 0.481869424652427.
Ответ или решение
Условная корреляция — это измерение силы и направления линейной зависимости между двумя переменными, принимая во внимание определенное условие или подмножество данных. В данном случае необходимо рассчитать корреляцию между столбцами "A" и "B" для записей с местоположением "Дели".
Для достижения этой цели мы можем воспользоваться функциональными возможностями программ, таких как Excel, для фильтрации данных по условию и последующего вычисления корреляции. Excel предоставляет функцию CORREL()
, которая вычисляет корреляцию между двумя массивами данных. Однако она применяется ко всему диапазону значений, если не указано условие фильтрации.
Для расчета условной корреляции только для "Дели" мы можем использовать формулу на основе массива. Эта формула фильтрует данные по местоположению и применяет функцию корреляции только к отфильтрованным значениям. В следующем примере формулы используется функционал массива, доступный в Excel:
=CORREL(IF(A2:A9="Дели", C2:C9), IF(A2:A9="Дели", D2:D9))
Каждая часть функции IF
выбирает значения из столбцов C и D только в том случае, если соответствующее значение в столбце A равно "Дели". Это обеспечивает работу только с подмножеством данных, удовлетворяющим заданному условию.
Важно отметить, что эта формула является формулой массива. Поэтому необходимо нажать Ctrl+Shift+Enter, чтобы ввести ее в Excel. Правильный ввод будет обозначен фигурными скобками вокруг формулы, добавленными автоматически Excel.
Выполнение вышеописанных шагов даст корреляцию 0.481869424652427 для вашего примера данных. Этот результат отражает линейную зависимость между интересующими вас переменными "A" и "B" именно для записей, относящихся к "Дели". Такой подход позволяет получить точные и релевантные данные, что особенно полезно для анализа, где условная фильтрация играет важную роль.
В заключение, условная корреляция помогает углубленно анализировать данные, выделяя конкретные аспекты, и, таким образом, способствует принятию более обоснованных решений на основе аналитических выводов.