RL-interactielus
Zoals je inmiddels weet, draait RL om een agent die in een omgeving beslissingen neemt om een vorm van cumulatieve beloning te maximaliseren. De agent moet via interactie ontdekken welke acties de meeste beloning opleveren.
Deze oefening maakt deel uit van de cursus
Reinforcement Learning met Gymnasium in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen