Interactie met de Frozen Lake-omgeving
Nu ga je door de Frozen Lake-omgeving navigeren, een roosterwereld waarin acties een agent in specifieke richtingen verplaatsen. Je taak is om de omgeving goed te bekijken en handmatig een lijst met actions te definiëren die de agent van de start (linksboven) naar het doel (rechtsonder) loodst, zonder in gaten te vallen. In de Frozen Lake-omgeving worden acties doorgaans als volgt weergegeven:
- 0: links
- 1: omlaag
- 2: rechts
- 3: omhoog
Zorg er na het uitvoeren van je code voor dat je door je plots bladert met de knoppen 'Previous Plot' en 'Next Plot' om het gevolgde pad te zien. Dit helpt je de volgorde van acties en hun effecten te begrijpen.
gym en plt zijn geïmporteerd, evenals de functie render() en de variabele env.
Deze oefening maakt deel uit van de cursus
Reinforcement Learning met Gymnasium in Python
Oefeninstructies
- Bekijk de positie van de agent rechts en definieer een lijst met
actionsom de agent over het meer naar het doel te sturen. - Voer elke actie in de lijst uit via de
for-lus. - Render de omgeving na elke actie om het pad van de agent te volgen.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Define the sequence of actions
actions = [____]
for action in actions:
# Execute each action
state, reward, terminated, _, _ = ____
# Render the environment
____
if terminated:
print("You reached the goal!")