Aan de slagGa gratis aan de slag

RL interaction loop

As you know by now, RL involves an agent making decisions in an environment to maximize some notion of cumulative reward. The agent must discover which actions yield the most reward through interaction.

Deze oefening maakt deel uit van de cursus

Reinforcement Learning with Gymnasium in Python

Cursus bekijken

Praktische interactieve oefening

Zet theorie om in actie met een van onze interactieve oefeningen.

Begin met trainen