LoslegenKostenlos starten

Zustands- und Aktionsräume erkunden

Im Cliff-Walking-Umfeld überquert ein Agent eine Gitterwelt vom Start bis zum Ziel und vermeidet dabei den Abgrund. Bewegt sich der Spieler auf eine Klippenposition, kehrt er zum Startpunkt zurück. Der Spieler führt Züge aus, bis er das Ziel erreicht; dann endet die Episode. Deine Aufgabe ist es, die Zustands- und Aktionsräume dieses Umfelds zu untersuchen.

Image showing an animation for the cliff walking environment.

Diese Übung ist Teil des Kurses

<Kurs>Reinforcement Learning mit Gymnasium in Python</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erzeuge eine Umgebungsinstanz für Cliff Walking mit der Umgebungs-ID CliffWalking.
  • Berechne die Größe des Aktionsraums und speichere sie in num_actions.
  • Berechne die Größe des Zustandsraums und speichere sie in num_states.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create the Cliff Walking environment
env = ____

# Compute the size of the action space
num_actions = ____

# Compute the size of the state space
num_states = ____

print("Number of actions:", num_actions)
print("Number of states:", num_states)
Code bearbeiten und ausführen