Boucle d’interaction en RL
Comme vous le savez désormais, le RL consiste à ce qu’un agent prenne des décisions dans un environnement pour maximiser une notion de récompense cumulée. L’agent doit découvrir, par l’interaction, quelles actions rapportent le plus.
Cet exercice fait partie du cours
<cours>Reinforcement Learning avec Gymnasium en Python</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice