1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning with Gymnasium in Python

Connected

cvičení

Komponenty vlastního MDP Frozen Lake

Toto prostředí mřížkového světa je variací prostředí Frozen Lake, kde se agent musí dostat k cíli a přitom se vyhýbat dírám. Tvým úkolem je toto prostředí analyzovat a popsat ho jako MDP zodpovězením několika otázek.

Odpovědi můžeš zjistit vizuální inspekcí prostředí, kde to přichází v úvahu, nebo pomocí předpřipravené proměnné env.

Pokyny 1/4

undefined XP
    1
    2
    3
    4

Otázka

Kolik akcí máme k dispozici?

Možné odpovědi