Durum ve eylem uzaylarını keşfetme
Cliff Walking ortamında, bir ajan uçurumdan düşmeden başlangıçtan hedefe doğru bir ızgara dünyasını geçer. Oyuncu uçurum karesine hareket ederse başlangıç konumuna döner. Oyuncu hedefe ulaşana kadar hamle yapar ve hedefe ulaşıldığında bölüm (episode) sona erer. Görevin, bu ortamın durum ve eylem uzaylarını keşfetmektir.

Bu egzersiz, kursun bir parçasıdır
Python ile Gymnasium'da Reinforcement Learning
Egzersiz talimatları
- Ortam kimliği
CliffWalkingolan Cliff Walking için bir ortam örneği oluştur. - Eylem uzayının boyutunu hesaplayıp
num_actionsiçinde sakla. - Durum uzayının boyutunu hesaplayıp
num_statesiçinde sakla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Create the Cliff Walking environment
env = ____
# Compute the size of the action space
num_actions = ____
# Compute the size of the state space
num_states = ____
print("Number of actions:", num_actions)
print("Number of states:", num_states)