CommencerCommencez gratuitement

Boucle d’interaction en RL

Comme vous le savez désormais, le RL consiste à ce qu’un agent prenne des décisions dans un environnement pour maximiser une notion de récompense cumulée. L’agent doit découvrir, par l’interaction, quelles actions rapportent le plus.

Cet exercice fait partie du cours

<cours>Reinforcement Learning avec Gymnasium en Python</cours>
Voir le cours

Exercice interactif pratique

Transformez la théorie en action avec l’un de nos exercices interactifs

Commencer l’exercice