Zustands- und Aktionsräume erkunden
Im Cliff-Walking-Umfeld überquert ein Agent eine Gitterwelt vom Start bis zum Ziel und vermeidet dabei den Abgrund. Bewegt sich der Spieler auf eine Klippenposition, kehrt er zum Startpunkt zurück. Der Spieler führt Züge aus, bis er das Ziel erreicht; dann endet die Episode. Deine Aufgabe ist es, die Zustands- und Aktionsräume dieses Umfelds zu untersuchen.

Diese Übung ist Teil des Kurses
Reinforcement Learning mit Gymnasium in Python
Anleitung zur Übung
- Erzeuge eine Umgebungsinstanz für Cliff Walking mit der Umgebungs-ID
CliffWalking. - Berechne die Größe des Aktionsraums und speichere sie in
num_actions. - Berechne die Größe des Zustandsraums und speichere sie in
num_states.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create the Cliff Walking environment
env = ____
# Compute the size of the action space
num_actions = ____
# Compute the size of the state space
num_states = ____
print("Number of actions:", num_actions)
print("Number of states:", num_states)