1. Nauka
  2. /
  3. Kursy
  4. /
  5. Uczenie przez wzmacnianie z Gymnasium w Pythonie

Connected

ćwiczenie

Eksploracja przestrzeni stanów i akcji

Środowisko Cliff Walking polega na tym, że agent przemieszcza się po siatce od punktu startowego do celu, unikając spadnięcia ze skały. Jeśli gracz trafi na pole ze skałą, wraca do punktu startowego. Gra toczy się do momentu, gdy gracz osiągnie cel – wtedy epizod się kończy. Twoim zadaniem jest zbadanie przestrzeni stanów i akcji tego środowiska.

Image showing an animation for the cliff walking environment.

Instrukcje

100 XP
  • Utwórz instancję środowiska Cliff Walking, używając identyfikatora CliffWalking.
  • Oblicz rozmiar przestrzeni akcji i zapisz wynik w zmiennej num_actions.
  • Oblicz rozmiar przestrzeni stanów i zapisz wynik w zmiennej num_states.