Выполните множественную линейную регрессию в Google Sheets.

Вопрос или проблема

Я пытаюсь запустить множественную линейную регрессию в Google Sheets, но единственное расширение, которое я могу найти для этого (XLMiner), было отключено Google в ожидании проверки. Также похоже, что процесс проверки занимает уже более 8 месяцев, так что я сомневаюсь, что оно будет доступно в ближайшее время.

Существуют ли альтернативные расширения или формула, которую я мог бы создать в самом листе, чтобы выполнить множественную линейную регрессию?

Формула LINEST

Один из вариантов — использовать встроенную функцию LINEST Google Sheets, ознакомьтесь с этой статьей для получения дополнительной информации.

Однако LINEST не выполняет автоматическую стандартную шкалировку входных данных, и не поддерживает разделение на тренировочные и тестовые наборы, а также перекрестную проверку, что считается хорошей практикой. Поэтому есть также второй вариант.

Расширение TableTorch для Google Sheets

TableTorch поддерживает линейные регрессии с расширенными опциями, такими как стандартная шкалировка, перекрестная проверка, преобразование меток, стратифицированная выборка и др., его интерфейс позволяет быстро оценить качественные метрики модели и вставить столбец предсказаний, который можно использовать на новых данных. Вот несколько ссылок:

  1. Установить расширение TableTorch для Google Sheets через Google Workspace Marketplace.
  2. Статья-руководство TableTorch по линейным регрессиям.
  3. Видеоурок о использовании функции линейной регрессии TableTorch.

Ответ или решение

Как выполнить множественную линейную регрессию в Google Sheets

Введение

При выполнении множественной линейной регрессии в Google Sheets у вас больше нет необходимости полагаться на сторонние надстройки, такие как XLMiner, которые могут быть недоступны или временно отключены. Google Sheets предоставляет встроенные функции и доступные надстройки, которые позволят вам успешно выполнить анализ. В этом руководстве мы рассмотрим, как использовать функцию LINEST и надстройку TableTorch.

1. Использование функции LINEST

Функция LINEST является мощным инструментом для выполнения множественной линейной регрессии в Google Sheets. Вот пошаговая инструкция по ее использованию:

Шаг 1: Подготовка данных

Убедитесь, что ваши данные организованы в столбцах. Например:

  • Столбец A: Переменная Y (зависимая)
  • Столбцы B, C, D и т.д.: Независимые переменные (X1, X2, X3)
Шаг 2: Ввод формулы
  1. Выберите ячейку, в которую вы хотите вставить результаты регрессии.
  2. Введите следующую формулу:
    =LINEST(A2:A100, B2:D100, TRUE, TRUE)

    Здесь A2:A100 — это диапазон ваших зависимых переменных, а B2:D100 — диапазон независимых переменных. Параметр TRUE указывает на то, что мы хотим получать дополнительные статистические данные.

Шаг 3: Интерпретация результатов

Функция LINEST вернет массив значений. В первом ряду вы увидите коэффициенты для каждой независимой переменной, а в следующих строках — статистику, такую как стандартные ошибки и коэффициент детерминации.

2. Использование надстройки TableTorch

Если вы ищете более продвинутые функции анализа, такие как стандартная шкалировка и кросс-валидация, можно воспользоваться надстройкой TableTorch.

Шаг 1: Установка надстройки
  1. Перейдите в Google Workspace Marketplace.
  2. Найдите «TableTorch» и установите ее.
Шаг 2: Запуск анализа

После установки TableTorch:

  1. Выберите диапазон ваших данных.
  2. Перейдите в меню надстройки и выберите опцию для проведения линейной регрессии.
  3. Укажите необходимые параметры, такие как выбор тренировки-теста и любые трансформации меток.
Шаг 3: Получение результатов

TableTorch предоставит удобный интерфейс для просмотра результатов и визуализации вашей модели. Вы сможете легко получить метрики качества модели и даже встроить колонку с предсказаниями для новых данных.

Итоги

Несмотря на временные ограничения с надстройками, Google Sheets обеспечивает мощные инструменты для выполнения множественной линейной регрессии как встроенными функциями, так и доступными надстройками. Использование функции LINEST подходит для базовых анализов, а TableTorch предлагает дополнительные возможности для более серьезного подхода к анализу данных.

Постоянно следите за обновлениями Google Sheets и доступными надстройками, чтобы оставаться на передовом крае анализа данных. Удачи в вашей работе с множественной линейной регрессией!

Полезные ссылки

Эти ресурсы помогут вам быстро разобраться с инструментами, доступными в Google Sheets, и начать использовать их для ваших аналитических задач.

Оцените материал
Добавить комментарий

Капча загружается...