Aan de slagGa gratis aan de slag

Aangepaste Frozen Lake-MDP-componenten

De meegeleverde gridworld-omgeving is een variant van de Frozen Lake-omgeving waarin een agent naar een doel moet navigeren terwijl hij gaten vermijdt. Jouw taak is om deze omgeving te analyseren en te formuleren als een MDP door specifieke vragen te beantwoorden.

Je kunt proberen te antwoorden door de omgeving visueel te inspecteren, waar van toepassing, of door gebruik te maken van de variabele env die al voor je is geladen.

Deze oefening maakt deel uit van de cursus

Reinforcement Learning met Gymnasium in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen