1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶGymnasiumによるReinforcement Learning

Connected

演習

Frozen Lake 環境との対話

これから Frozen Lake 環境を操作します。これはグリッド状の世界で、アクションによってエージェントが特定の方向へ移動します。課題は、環境をよく観察し、スタート(左上)からゴール(右下)まで、穴に落ちないように進むための actions のリストを手作業で定義することです。Frozen Lake でのアクションの表現は通常次のとおりです。

  • 0: left
  • 1: down
  • 2: right
  • 3: up

コードを実行したら、"Previous Plot" と "Next Plot" のボタンを使ってプロットを切り替え、たどった経路を確認してください。 これにより、アクションの並びとその結果が理解しやすくなります。

gym と plt はすでにインポートされており、render() 関数と env 変数も用意されています。

指示

100 XP
  • 右側のエージェントの位置を観察し、湖を渡ってゴールまで導く actions のリストを定義します。
  • for ループでリスト内の各アクションを順番に実行します。
  • 各アクションの後に環境をレンダリングし、エージェントの経路を確認します。