Машинное обучение, статистика и математика

Question 1

Я только начал углубляться в машинное обучение, и каждый раз, когда я пытаюсь разобраться в концепциях или коде, я сталкиваюсь с математическими задачами и их запутанными обозначениями. Имея опыт в компьютерных науках, я немного их понимаю, но большинство уходит вбок.

Например, возьмем ниже приведенные формулы с этой страницы –

Я пытаюсь и действительно хочу их понять, но как-то путаюсь и каждый раз оставляю это.

Не могли бы вы подсказать, с чего начать? Буду признателен за начальные указания или советы.

Question 2

Это действительно правда, что статьи или книги используют обозначения, которые иногда кажутся очевидными для людей, которые привыкли работать с математическими аспектами, но не имеют смысла для других. Способы понимания математики включают:

Посещение теоретических курсов или тренингов
Чтение специализированных книг
Вопросы людям вокруг вас
Обращение к людям на форумах, таких как этот, или Cross Validated для статистических формул
Попытки самостоятельно понять, пересматривая части статьи/книги, которые не уяснили с первого раза

Существуют некоторые обозначения/конвенции, которые неявно приняты в статьях по науке о данных/машинному обучению, такие как:

Использование $X$ в качестве ввода, $y$ в качестве вывода, $\theta$ в качестве параметров модели
Использование $\hat{y}$ для оценки истинного $y$
Предположение, что векторы являются столбцовыми векторами

Список был бы слишком длинным, чтобы включить его сюда.

Что касается приведенного выше примера, то мы имеем дело с ограниченной оптимизацией.

Утверждение $max$ означает, что мы ищем максимальное значение выражения, которое следует после. То, что находится ниже (то есть значения $\Delta_{ij}$), является списком “свободных” параметров, которые изменяют значение выражения.

Утверждение $max$ предшествует $arg$, что означает, что мы не заинтересованы в максимальном значении выражения, а скорее в наборе $\Delta_{ij}$, который приводит к этому значению.

Затем мы сталкиваемся с утверждением $s.t.$, потому что это не обычная оптимизация, мы также должны учитывать несколько ограничений, выраженных после $s.t.$. Это могут быть неравенства, уравнения, ограничения принадлежности и т. д., как явные ($\Delta_{ij} > 0$), так и более неявные.

Question 3

Я бы рекомендовал путь обучения в формате TOP-DOWN:

Получите первое представление о том, какие типы алгоритмов существуют на основе возможных случаев использования (классификация, регрессия, кластеризация и т. д.); таким образом, вы знаете ЧТО Я МОГУ РЕШИТЬ С ЭТИМ
Для алгоритмов, которые вас интересуют (базовым может быть линейная регрессия, обученная с помощью градиентного спуска), вы можете получить первое представление, используя такие библиотеки, как
scikit-learn, которые оборачивают математику между ними, но дают вам результаты, которые вы можете быстро проверить и поиграть с ними –> КАК Я МОГУ ЭТО РЕШИТЬ
После того, как вы немного поиграете с этим, вы сможете более глубоко рассмотреть, как работают алгоритмы, с линейной алгеброй, статистикой и концепциями анализа, которые вам нужно действительно понять (в основном, это математические формулы, о которых вы говорили) –> КАК ЭТО РАБОТАЕТ

Хорошие источники:

Книга “Python Machine Learning” Себастьяна Рашки (хороший баланс между теорией и практикой)
Блог и книги Джейсона Браунли (очень практические случаи использования)
Документация scikit-learn, которая включает в себя математику, использованную в их коде

Question 4

Если вы слишком стараетесь, спросите себя, получаете ли вы от этого удовольствие. Если вы спрашиваете себя, получаете ли вы от этого удовольствие, то, возможно, вам стоит спросить себя, что именно вам действительно нравится.

В противном случае попробуйте серию книг Schaum по математическому анализу, линейной алгебре, статистике. Это отличные книги для начинающих: https://www.amazon.com/Schaums-Outline-Linear-Algebra-Outlines/dp/1260011445

Машинное обучение, статистика и математика

Вопрос или проблема

Ответ или решение

Понимание машинного обучения через математику, статистику и вычисления

Основные Нотации и Концепции

Оптимизация и Ограничения

Рекомендации по обучению

Рекомендуемые источники

Заключение