Eigene MDP-Komponenten für Frozen Lake
Die bereitgestellte Gridworld-Umgebung ist eine Variante der Frozen-Lake-Umgebung, in der ein Agent ein Ziel erreichen muss, ohne in Löcher zu fallen. Deine Aufgabe ist es, diese Umgebung zu analysieren und als MDP zu formulieren, indem du konkrete Fragen beantwortest.
Du kannst die Antworten durch visuelle Inspektion der Umgebung finden (wo sinnvoll) oder die für dich vorab geladene Variable env nutzen.
Diese Übung ist Teil des Kurses
Reinforcement Learning mit Gymnasium in Python
Interaktive Übung
In dieser interaktiven Übung kannst du die Theorie in die Praxis umsetzen.
Übung starten