Durum ve eylem uzaylarını keşfetme
Cliff Walking ortamında, bir ajan uçurumdan düşmeden başlangıçtan hedefe doğru bir ızgara dünyasını geçer. Oyuncu uçurum karesine hareket ederse başlangıç konumuna döner. Oyuncu hedefe ulaşana kadar hamle yapar ve hedefe ulaşıldığında bölüm (episode) sona erer. Görevin, bu ortamın durum ve eylem uzaylarını keşfetmektir.

Bu egzersiz
Python ile Gymnasium'da Reinforcement Learning
kursunun bir parçasıdırEgzersiz talimatları
- Ortam kimliği
CliffWalkingolan Cliff Walking için bir ortam örneği oluştur. - Eylem uzayının boyutunu hesaplayıp
num_actionsiçinde sakla. - Durum uzayının boyutunu hesaplayıp
num_statesiçinde sakla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Create the Cliff Walking environment
env = ____
# Compute the size of the action space
num_actions = ____
# Compute the size of the state space
num_states = ____
print("Number of actions:", num_actions)
print("Number of states:", num_states)