Interagindo com o ambiente Frozen Lake
Agora você vai navegar pelo ambiente Frozen Lake, um mundo em grade onde as ações movem um agente em direções específicas. Sua tarefa é observar com atenção o ambiente e definir manualmente uma lista de actions que levará o agente do início (canto superior esquerdo) até o objetivo (canto inferior direito) sem cair em nenhum buraco. No ambiente Frozen Lake, as ações geralmente são representadas como:
- 0: esquerda
- 1: baixo
- 2: direita
- 3: cima
Depois de executar seu código, não deixe de navegar pelos seus gráficos usando os botões 'Previous Plot' e 'Next Plot'. Isso vai ajudar você a entender a sequência de ações e seus resultados.
gym e plt já foram importados, assim como a função render() e a variável env.
Este exercício faz parte do curso
Reinforcement Learning com Gymnasium em Python
Instruções do exercício
- Observe a posição do agente à direita e defina uma lista de
actionspara conduzir o agente pelo lago até o objetivo. - Execute cada ação da lista usando o loop
for. - Renderize o ambiente após cada ação para observar o caminho do agente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Define the sequence of actions
actions = [____]
for action in actions:
# Execute each action
state, reward, terminated, _, _ = ____
# Render the environment
____
if terminated:
print("You reached the goal!")