Aan de slagGa gratis aan de slag

Interactie met de Frozen Lake-omgeving

Nu ga je door de Frozen Lake-omgeving navigeren, een roosterwereld waarin acties een agent in specifieke richtingen verplaatsen. Je taak is om de omgeving goed te bekijken en handmatig een lijst met actions te definiëren die de agent van de start (linksboven) naar het doel (rechtsonder) loodst, zonder in gaten te vallen. In de Frozen Lake-omgeving worden acties doorgaans als volgt weergegeven:

  • 0: links
  • 1: omlaag
  • 2: rechts
  • 3: omhoog

Zorg er na het uitvoeren van je code voor dat je door je plots bladert met de knoppen 'Previous Plot' en 'Next Plot' om het gevolgde pad te zien. Dit helpt je de volgorde van acties en hun effecten te begrijpen.

gym en plt zijn geïmporteerd, evenals de functie render() en de variabele env.

Deze oefening maakt deel uit van de cursus

Reinforcement Learning met Gymnasium in Python

Cursus bekijken

Oefeninstructies

  • Bekijk de positie van de agent rechts en definieer een lijst met actions om de agent over het meer naar het doel te sturen.
  • Voer elke actie in de lijst uit via de for-lus.
  • Render de omgeving na elke actie om het pad van de agent te volgen.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Define the sequence of actions
actions = [____]

for action in actions:
  # Execute each action
  state, reward, terminated, _, _ = ____
  # Render the environment
  ____
  if terminated:
  	print("You reached the goal!")
Code bewerken en uitvoeren