CommencerCommencer gratuitement

Boucle d’interaction en RL

Comme vous le savez désormais, le RL consiste à ce qu’un agent prenne des décisions dans un environnement pour maximiser une notion de récompense cumulée. L’agent doit découvrir, par l’interaction, quelles actions rapportent le plus.

Cet exercice fait partie du cours

Reinforcement Learning avec Gymnasium en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice