学ぶ

/

コース

/

Pythonで学ぶGymnasiumによるReinforcement Learning

Connected

演習

カスタム Frozen Lake の MDP 構成要素

ここで扱うグリッドワールド環境は、エージェントが穴を避けながらゴールへ到達する Frozen Lake 環境のバリエーションです。あなたの課題は、この環境を分析し、いくつかの質問に答えることで MDP として定式化することです。

必要に応じて環境を目視で確認しても、事前に読み込まれている env 変数を使って調べてもかまいません。

指示1 / 4

undefined XP

質問

アクションはいくつありますか？

選択肢

2

3

4

5