Aangepaste Frozen Lake-MDP-componenten
De meegeleverde gridworld-omgeving is een variant van de Frozen Lake-omgeving waarin een agent naar een doel moet navigeren terwijl hij gaten vermijdt. Jouw taak is om deze omgeving te analyseren en te formuleren als een MDP door specifieke vragen te beantwoorden.
Je kunt proberen te antwoorden door de omgeving visueel te inspecteren, waar van toepassing, of door gebruik te maken van de variabele env die al voor je is geladen.
Deze oefening maakt deel uit van de cursus
Reinforcement Learning met Gymnasium in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen