1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning with Gymnasium in Python

Connected

cvičení

Prozkoumání stavového a akčního prostoru

Prostředí Cliff Walking představuje agenta, který přechází mřížkovým světem ze startovní pozice do cíle a přitom se vyhýbá pádu ze skály. Pokud se hráč přesune na políčko se skálou, vrátí se zpět na start. Hráč pokračuje v pohybu, dokud nedosáhne cíle – tím epizoda končí. Tvým úkolem je prozkoumat stavový a akční prostor tohoto prostředí.

Image showing an animation for the cliff walking environment.

Pokyny

100 XP
  • Vytvoř instanci prostředí Cliff Walking s ID prostředí CliffWalking.
  • Vypočítej velikost akčního prostoru a výsledek ulož do num_actions.
  • Vypočítej velikost stavového prostoru a výsledek ulož do num_states.