Interaktion mit der Frozen-Lake-Umgebung
Jetzt navigierst du die Frozen-Lake-Umgebung, eine rasterbasierte Welt, in der Aktionen den Agenten in bestimmte Richtungen bewegen. Deine Aufgabe ist es, dir die Umgebung genau anzuschauen und manuell eine Liste von actions zu definieren, die den Agenten vom Start (oben links) bis zum Ziel (unten rechts) führt, ohne in Löcher zu fallen. In der Frozen-Lake-Umgebung werden Aktionen typischerweise wie folgt dargestellt:
- 0: links
- 1: unten
- 2: rechts
- 3: oben
Nachdem du deinen Code ausgeführt hast, navigiere unbedingt durch deine Plots, um den zurückgelegten Pfad zu sehen, indem du die Buttons "Previous Plot" und "Next Plot" verwendest. So verstehst du die Abfolge der Aktionen und ihre Ergebnisse besser.
gym und plt wurden zusammen mit der Funktion render() und der Variable env importiert.
Diese Übung ist Teil des Kurses
Reinforcement Learning mit Gymnasium in Python
Anleitung zur Übung
- Beobachte die Position des Agenten rechts und definiere eine Liste von
actions, um den Agenten über den See bis zum Ziel zu navigieren. - Führe jede Aktion in der Liste über die
for-Schleife aus. - Render die Umgebung nach jeder Aktion, um den Pfad des Agenten zu beobachten.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Define the sequence of actions
actions = [____]
for action in actions:
# Execute each action
state, reward, terminated, _, _ = ____
# Render the environment
____
if terminated:
print("You reached the goal!")