1. 학습
  2. /
  3. 강의
  4. /
  5. Pythonで学ぶGymnasiumによるReinforcement Learning

Connected

연습 문제

カスタム Frozen Lake の MDP 構成要素

ここで扱うグリッドワールド環境は、エージェントが穴を避けながらゴールへ到達する Frozen Lake 環境のバリエーションです。あなたの課題は、この環境を分析し、いくつかの質問に答えることで MDP として定式化することです。

必要に応じて環境を目視で確認しても、事前に読み込まれている env 変数を使って調べてもかまいません。

지침 1/4

undefined XP
    1
    2
    3
    4

질문

アクションはいくつありますか?

가능한 답변