stable-baselines - ответы на вопросы

Вопросы и ответы

Не удалось достичь такой же хорошей производительности PPO с MAPPO.

Вопрос или проблема У меня есть многопользовательская среда, основанная на боидов, использующая gymnasium. Я использовал PPO с политикой Mlp и сетью из 8 слоев по 512 нейронов в каждом слое. Хотя я достиг объединения, это было централизованное решение.

Вопросы и ответы

Почему я не могу установить seed для своей программы DQN, используя sbx?

Вопрос или проблема Я пытаюсь задать начальное состояние для своей программы DQN, используя sbx, но по какой-то причине я постоянно получаю разные результаты. Вот попытка создать минимальный воспроизводимый пример – import gymnasium as gym import