Каждый знает моделирование, основанное на данных, но что такое моделирование, основанное на модели (или не основанное на данных)?

Question 1

Существует множество моделей машинного обучения, основанных на данных. Легко назвать несколько из них: нейронные сети, линейная регрессия, SVM и так далее… но что такое моделирование, не основанное на данных (или модельное), и какие известные и практичные примеры существуют, например, для задач регрессии?

Question 2

Если модель не выводится из данных, то она должна быть построена вручную, так что отсутствие зависимости от данных означает правило-ориентированный подход.

Это была большая тенденция в области искусственного интеллекта в 80-х годах до эпохи машинного обучения; эти системы автоматического прогнозирования до МЛ назывались экспертными системами и были в то время довольно успешными в промышленности (вот некоторые примеры приложений).

Способ построения системы для задачи регрессии в основном таков: выполнить весь анализ регрессии вручную, найти параметры и жестко зафиксировать их в системе прогнозирования.

Насколько я знаю, машинное обучение в значительной степени сделало этот вид систем, основанных на правилах, устаревшими из-за их полной негибкости и очень высокой стоимости ручного труда для их создания.

Question 3

Методы, основанные на данных, полагаются на эмпирическое наблюдение и создают модели, которые сопоставляют наблюдаемые входные и выходные данные. Модели, не основанные на данных, могут быть построены на основе знаний о предметной области или первых принципов без необходимости в большом количестве экспериментальных данных, но обычно они ограничены вашим пониманием правил, управляющих системой.

Например, предположим, что кто-то хочет создать модель орбиты Земли вокруг Солнца. Можно было бы измерить положение Земли во времени и построить модель, основанную на данных, которая учитывает ваши наблюдения. Альтернативно, можно использовать знания о физических законах вселенной (гравитация и законы Ньютона) для построения модели орбиты Земли, которая будет чисто теоретической и не будет опираться на сбор большого количества данных.

Некоторые сложные системы, такие как погода или межмолекулярные силы, трудно наблюдать с достаточным разрешением, чтобы построить точную модель, основанную на данных. В таких сценариях, когда у нас нет данных, необходимых для построения хорошей модели на основе данных, все еще возможно построить физическую модель для прогнозирования. Долгосрочные прогнозы погоды, например, традиционно генерируются физическими моделями атмосферы, хотя модели, основанные на данных, которые напрямую обучены объяснению наблюдаемых данных, становятся более распространенными.

Каждый знает моделирование, основанное на данных, но что такое моделирование, основанное на модели (или не основанное на данных)?

Вопрос или проблема

Ответ или решение