CommencerCommencer gratuitement

Composants MDP d’un Frozen Lake personnalisé

L’environnement de grille fourni est une variante de Frozen Lake, où un agent doit atteindre un objectif tout en évitant des trous. Votre tâche consiste à analyser cet environnement et à le formuler comme un MDP en répondant à des questions précises.

Vous pouvez tenter de répondre en inspectant visuellement l’environnement, lorsque c’est pertinent, ou en utilisant la variable env déjà chargée pour vous.

Cet exercice fait partie du cours

Reinforcement Learning avec Gymnasium en Python

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice