Explorando os espaços de estados e ações
O ambiente Cliff Walking envolve um agente atravessando um mundo em grade do ponto inicial até o objetivo, evitando cair de um penhasco. Se o jogador se move para uma posição de penhasco, ele volta para o ponto inicial. O jogador faz movimentos até alcançar o objetivo, o que encerra o episódio. Sua tarefa é explorar os espaços de estados e de ações desse ambiente.

Este exercício faz parte do curso
Reinforcement Learning com Gymnasium em Python
Instruções do exercício
- Crie uma instância do ambiente para Cliff Walking com o ID do ambiente
CliffWalking. - Calcule o tamanho do espaço de ações e armazene em
num_actions. - Calcule o tamanho do espaço de estados e armazene em
num_states.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Create the Cliff Walking environment
env = ____
# Compute the size of the action space
num_actions = ____
# Compute the size of the state space
num_states = ____
print("Number of actions:", num_actions)
print("Number of states:", num_states)