LoslegenKostenlos loslegen

Zustands- und Aktionsräume erkunden

Im Cliff-Walking-Umfeld überquert ein Agent eine Gitterwelt vom Start bis zum Ziel und vermeidet dabei den Abgrund. Bewegt sich der Spieler auf eine Klippenposition, kehrt er zum Startpunkt zurück. Der Spieler führt Züge aus, bis er das Ziel erreicht; dann endet die Episode. Deine Aufgabe ist es, die Zustands- und Aktionsräume dieses Umfelds zu untersuchen.

Image showing an animation for the cliff walking environment.

Diese Übung ist Teil des Kurses

Reinforcement Learning mit Gymnasium in Python

Kurs anzeigen

Anleitung zur Übung

  • Erzeuge eine Umgebungsinstanz für Cliff Walking mit der Umgebungs-ID CliffWalking.
  • Berechne die Größe des Aktionsraums und speichere sie in num_actions.
  • Berechne die Größe des Zustandsraums und speichere sie in num_states.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create the Cliff Walking environment
env = ____

# Compute the size of the action space
num_actions = ____

# Compute the size of the state space
num_states = ____

print("Number of actions:", num_actions)
print("Number of states:", num_states)
Code bearbeiten und ausführen