openai-gym
Data Science
Вопрос или проблема Я пытался написать агента с обучением с подкреплением, используя библиотеку stable-baselines3. Метод agent(abservations) должен возвращать действие. Я прошел через API различных моделей (например, PPO), и они на самом деле не позволяют
Data Science
Вопрос или проблема OpenAI Gym действительно нормализовал способ выполнения обучения с подкреплением. Он позволяет ученым данных разделять разработку модели и настройку/создание окружения и сосредотачиваться на том, на чем им действительно следует сосредотачиваться.
Data Science
Вопрос или проблема В настоящее время я изучаю обучение с подкреплением и хотел бы применить его в среде car racing-v0. Я успешно реализовал это с помощью алгоритма PPO, и теперь хочу использовать алгоритм DQN, но когда я пытаюсь обучить модель, возникает
Data Science
Вопрос или проблема Я создаю свою кастомную среду Gym, и до сих пор всё работало хорошо, следуя инструкциям, распространённым по интернету. Однако сейчас я нахожусь на этапе, когда часто происходят изменения в классе среды (наследуя gym.
Data Science
Вопрос или проблема Я пытаюсь разобраться в эффектах is_slippery в среде open.ai FrozenLake-v0 . Согласно моим результатам, когда is_slippery=True, что является значением по умолчанию, решить задачу намного труднее, чем когда is_slippery=False.
Data Science
Вопрос или проблема Все стандартные окружения Gym/Gymnasium совместимы с агентами TwnsorFlow RL, но когда я пытался использовать TF-Agents с anytrading, я получал ошибки, потому что некоторые необходимые методы и атрибуты, похоже, отсутствуют.