openai-gym - ответы на вопросы

Data Science

Понимание пространства действий в Stable Baselines

00

Вопрос или проблема Я пытался написать агента с обучением с подкреплением, используя библиотеку stable-baselines3. Метод agent(abservations) должен возвращать действие. Я прошел через API различных моделей (например, PPO), и они на самом деле не позволяют

Data Science

Эквивалент OpenAI Gym для обучения с учителем и/или без учителя.

00

Вопрос или проблема OpenAI Gym действительно нормализовал способ выполнения обучения с подкреплением. Он позволяет ученым данных разделять разработку модели и настройку/создание окружения и сосредотачиваться на том, на чем им действительно следует сосредотачиваться.

Data Science

гимнастика автогонки v0 с использованием DQN

00

Вопрос или проблема В настоящее время я изучаю обучение с подкреплением и хотел бы применить его в среде car racing-v0. Я успешно реализовал это с помощью алгоритма PPO, и теперь хочу использовать алгоритм DQN, но когда я пытаюсь обучить модель, возникает

Data Science

OpenAI Gym: gym.make() не ссылается на обновленный код Env

00

Вопрос или проблема Я создаю свою кастомную среду Gym, и до сих пор всё работало хорошо, следуя инструкциям, распространённым по интернету. Однако сейчас я нахожусь на этапе, когда часто происходят изменения в классе среды (наследуя gym.

Data Science

Эффекты скользкости в среде OpenAI FrozenLake

00

Вопрос или проблема Я пытаюсь разобраться в эффектах is_slippery в среде open.ai FrozenLake-v0 . Согласно моим результатам, когда is_slippery=True, что является значением по умолчанию, решить задачу намного труднее, чем когда is_slippery=False.

Data Science

Совместимость окружения Anytrading Gym с TF-Agents

00

Вопрос или проблема Все стандартные окружения Gym/Gymnasium совместимы с агентами TwnsorFlow RL, но когда я пытался использовать TF-Agents с anytrading, я получал ошибки, потому что некоторые необходимые методы и атрибуты, похоже, отсутствуют.