ComeçarComece de graça

Interagindo com o ambiente Frozen Lake

Agora você vai navegar pelo ambiente Frozen Lake, um mundo em grade onde as ações movem um agente em direções específicas. Sua tarefa é observar com atenção o ambiente e definir manualmente uma lista de actions que levará o agente do início (canto superior esquerdo) até o objetivo (canto inferior direito) sem cair em nenhum buraco. No ambiente Frozen Lake, as ações geralmente são representadas como:

  • 0: esquerda
  • 1: baixo
  • 2: direita
  • 3: cima

Depois de executar seu código, não deixe de navegar pelos seus gráficos usando os botões 'Previous Plot' e 'Next Plot'. Isso vai ajudar você a entender a sequência de ações e seus resultados.

gym e plt já foram importados, assim como a função render() e a variável env.

Este exercício faz parte do curso

Reinforcement Learning com Gymnasium em Python

Ver curso

Instruções do exercício

  • Observe a posição do agente à direita e defina uma lista de actions para conduzir o agente pelo lago até o objetivo.
  • Execute cada ação da lista usando o loop for.
  • Renderize o ambiente após cada ação para observar o caminho do agente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Define the sequence of actions
actions = [____]

for action in actions:
  # Execute each action
  state, reward, terminated, _, _ = ____
  # Render the environment
  ____
  if terminated:
  	print("You reached the goal!")
Editar e executar o código