Eigene MDP-Komponenten für Frozen Lake
Die bereitgestellte Gridworld-Umgebung ist eine Variante der Frozen-Lake-Umgebung, in der ein Agent ein Ziel erreichen muss, ohne in Löcher zu fallen. Deine Aufgabe ist es, diese Umgebung zu analysieren und als MDP zu formulieren, indem du konkrete Fragen beantwortest.
Du kannst die Antworten durch visuelle Inspektion der Umgebung finden (wo sinnvoll) oder die für dich vorab geladene Variable env nutzen.
Diese Übung ist Teil des Kurses
<Kurs>Reinforcement Learning mit Gymnasium in Python</Kurs>Interaktive praktische Übung
Verwandle Theorie mit einer unserer interaktiven Übungen in die Praxis
Übung starten