1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶGymnasiumによるReinforcement Learning

Connected

演習

状態空間と行動空間を調べる

Cliff Walking 環境では、エージェントが崖に落ちないように気をつけながら、グリッド状の世界をスタートからゴールまで進みます。プレイヤーが崖の位置に移動すると、スタート地点に戻されます。ゴールに到達するまで移動を続け、到達するとエピソードが終了します。あなたのタスクは、この環境の状態空間と行動空間を調べることです。

Image showing an animation for the cliff walking environment.

指示

100 XP
  • 環境 ID CliffWalking を使って Cliff Walking の環境インスタンスを作成します。
  • 行動空間のサイズを計算し、num_actions に保存します。
  • 状態空間のサイズを計算し、num_states に保存します。