Explorer les espaces d’états et d’actions
L’environnement Cliff Walking consiste à faire traverser à un agent une grille depuis le départ jusqu’à l’objectif tout en évitant de tomber de la falaise. Si le joueur se déplace sur une case de falaise, il revient à la position de départ. Le joueur effectue des mouvements jusqu’à atteindre l’objectif, ce qui met fin à l’épisode. Votre tâche est d’explorer les espaces d’états et d’actions de cet environnement.

Cet exercice fait partie du cours
Reinforcement Learning avec Gymnasium en Python
Instructions
- Créez une instance d’environnement pour Cliff Walking avec l’identifiant d’environnement
CliffWalking. - Calculez la taille de l’espace d’actions et stockez-la dans
num_actions. - Calculez la taille de l’espace d’états et stockez-la dans
num_states.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Create the Cliff Walking environment
env = ____
# Compute the size of the action space
num_actions = ____
# Compute the size of the state space
num_states = ____
print("Number of actions:", num_actions)
print("Number of states:", num_states)