Boucle d’interaction en RL
Comme vous le savez désormais, le RL consiste à ce qu’un agent prenne des décisions dans un environnement pour maximiser une notion de récompense cumulée. L’agent doit découvrir, par l’interaction, quelles actions rapportent le plus.
Cet exercice fait partie du cours
Reinforcement Learning avec Gymnasium en Python
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice