monte-carlo
Data Science
Вопрос или проблема Концептуально я понимаю, как численный метод, такой как метод Монте-Карло, используется для решения определенного интеграла. Поскольку интеграл функции — это площадь, ограниченная кривой, отношение случайных точек, попадающих внутрь
Data Science
Вопрос или проблема Насколько я понимаю, в обучении с подкреплением контроль на основе отдаленных выборок методом Монте-Карло — это когда функция значений состояния-действия $Q(s,a)$ оценивается как средневзвешенное наблюдаемых вознаграждений.
Data Science
Вопрос или проблема Я теоретизирую идею использовать CNN и MCTS вместе для игры в определённую игру. В общих чертах, игра имеет следующие характеристики: Есть два игрока, и игра примерно пошаговая. На каждом ходе есть довольно много вариантов, из которых