1. 学ぶ
  2. /
  3. コース
  4. /
  5. Pythonで学ぶGymnasiumによるReinforcement Learning

Connected

演習

カスタム Frozen Lake の MDP 構成要素

ここで扱うグリッドワールド環境は、エージェントが穴を避けながらゴールへ到達する Frozen Lake 環境のバリエーションです。あなたの課題は、この環境を分析し、いくつかの質問に答えることで MDP として定式化することです。

必要に応じて環境を目視で確認しても、事前に読み込まれている env 変数を使って調べてもかまいません。

指示1 / 4

undefined XP
    1
    2
    3
    4

質問

アクションはいくつありますか?

選択肢