Data Science
Какова интуиция использования метода Монте-Карло для решения дифференциального уравнения?
00
Вопрос или проблема Концептуально я понимаю, как численный метод, такой как метод Монте-Карло, используется для решения определенного интеграла. Поскольку интеграл функции — это площадь, ограниченная кривой, отношение случайных точек, попадающих внутрь
Data Science
Почему бы не использовать max(возвраты) вместо average(возвраты) в офф-политике контроля Монте-Карло?
00
Вопрос или проблема Насколько я понимаю, в обучении с подкреплением контроль на основе отдаленных выборок методом Монте-Карло — это когда функция значений состояния-действия $Q(s,a)$ оценивается как средневзвешенное наблюдаемых вознаграждений.
Data Science
Запрос о использовании CNN и MCTS для определенной игры
00
Вопрос или проблема Я теоретизирую идею использовать CNN и MCTS вместе для игры в определённую игру. В общих чертах, игра имеет следующие характеристики: Есть два игрока, и игра примерно пошаговая. На каждом ходе есть довольно много вариантов, из которых