Aan de slagBegin gratis

Aangepaste Frozen Lake-MDP-componenten

De meegeleverde gridworld-omgeving is een variant van de Frozen Lake-omgeving waarin een agent naar een doel moet navigeren terwijl hij gaten vermijdt. Jouw taak is om deze omgeving te analyseren en te formuleren als een MDP door specifieke vragen te beantwoorden.

Je kunt proberen te antwoorden door de omgeving visueel te inspecteren, waar van toepassing, of door gebruik te maken van de variabele env die al voor je is geladen.

Deze oefening maakt deel uit van de cursus

Reinforcement Learning met Gymnasium in Python

Bekijk cursus

Interactieve oefening met praktijkervaring

Zet theorie om in actie met een van onze interactieve oefeningen

Begin oefening