Правильное решение машинного обучения для этой проблемы

Question 1

На протяжении моего понимания использования машинного обучения всегда существовал столбец с названием Target или Label, который заставлял нас использовать методы Supervised обучения. Теперь я не имею дело ни с supervised, ни с unsupervised процедурой. Я не знаю, что это такое. У меня есть несколько датафреймов, каждый из которых имеет 3 столбца. Столбцы имеют взаимосвязь друг с другом, но это не имеет значения. Я ищу способ показать эффект образцов друг на друга. В смысле того, что в моей теме теоретически доказано, что в определенной ситуации некоторые образцы важнее других. Теперь мне нужно показать это с помощью машинного обучения. Я сгенерировал необходимые данные для этой ситуации, но не знаю, как найти эффект образцов друг на друга. Я мог бы показать некоторые различия в образцах, но не смог найти какой-либо значимый сценарий для использования в машинном обучении. Чтобы прояснить, я определил значение, которое представляет собой вычисление между значениями каждого столбца, и мне хотелось бы узнать, в вычислении этого значения в определенном индексе, какой образец играет более важную роль. Теперь вопрос в том,

**КАК НАЙТИ ЭФФЕКТ ОБРАЗЦОВ ДРУГ НА ДРУГА С ПОМОЩЬЮ ПРОСТЫХ ИЛИ СЛОЖНЫХ ТЕХНИК?**

Чтобы лучше понять, давайте посмотрим на некоторый тип данных здесь.
Пример датафрейма приведен ниже:

S   C     E
0   0.2   1e-2
1  -0.15  2e-2
2   0.24  2e-3
3  -0.1   3e-1
4   0.3   2e-1

Третий столбец является комбинацией первых двух столбцов (существует уравнение комбинации). Теперь мне нужно знать, например, для E[2], каков эффект c[0],c[1],c[2],c[4].

Question 2

Во-первых, столбцы в вашем датафрейме называются признаками,
Таким образом, правильный вопрос для вас будет
Как найти корреляцию между признаками?

Как упоминалось в вопросе, вы хотите найти корреляцию между ними,

Итак,
Что такое Корреляция?
Ответ: Корреляция – это статистика, которая измеряет степень, в которой две переменные изменяются относительно друг друга.

Пример: Продажа мороженого

Местный магазин мороженого отслеживает, сколько мороженого они продают по сравнению с температурой в тот день, вот их данные за последние 12 дней:

А вот те же данные в виде диаграммы рассеяния:

Мы можем легко заметить, что более теплые дни и более высокие продажи идут вместе. Этот тип зависимости называется положительной корреляцией, что означает, что если одна переменная увеличивается, другая тоже увеличивается, следовательно, обе переменные предоставляют одну и ту же информацию.
В общем случае лучше исключить одну из них.

Правильное решение машинного обучения для этой проблемы

Вопрос или проблема

Ответ или решение

Понимание корреляции и взаимосвязей

Простой анализ с использованием корреляции

Продвинутые методы анализа

Заключение