1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. Python으로 배우는 Gymnasium 기반 Reinforcement Learning

Connected

Exercises

상태 공간과 행동 공간 살펴보기

Cliff Walking 환경에서는 에이전트가 낭떠러지를 피하면서 시작 지점에서 목표 지점까지 격자 세계를 가로질러 이동해요. 플레이어가 낭떠러지 칸으로 이동하면 시작 지점으로 되돌아갑니다. 목표에 도달할 때까지 계속 이동하며, 목표에 도달하면 에피소드가 종료돼요. 이 환경의 상태 공간과 행동 공간을 탐색해 보세요.

Image showing an animation for the cliff walking environment.

คำแนะนำ

100 XP
  • 환경 ID CliffWalking으로 Cliff Walking 환경 인스턴스를 생성하세요.
  • 행동 공간의 크기를 계산해 num_actions에 저장하세요.
  • 상태 공간의 크기를 계산해 num_states에 저장하세요.