BaşlayınÜcretsiz başlayın

Durum ve eylem uzaylarını keşfetme

Cliff Walking ortamında, bir ajan uçurumdan düşmeden başlangıçtan hedefe doğru bir ızgara dünyasını geçer. Oyuncu uçurum karesine hareket ederse başlangıç konumuna döner. Oyuncu hedefe ulaşana kadar hamle yapar ve hedefe ulaşıldığında bölüm (episode) sona erer. Görevin, bu ortamın durum ve eylem uzaylarını keşfetmektir.

Image showing an animation for the cliff walking environment.

Bu egzersiz, kursun bir parçasıdır

Python ile Gymnasium'da Reinforcement Learning

Kursa Göz Atın

Egzersiz talimatları

  • Ortam kimliği CliffWalking olan Cliff Walking için bir ortam örneği oluştur.
  • Eylem uzayının boyutunu hesaplayıp num_actions içinde sakla.
  • Durum uzayının boyutunu hesaplayıp num_states içinde sakla.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Create the Cliff Walking environment
env = ____

# Compute the size of the action space
num_actions = ____

# Compute the size of the state space
num_states = ____

print("Number of actions:", num_actions)
print("Number of states:", num_states)
Kodu Düzenle ve Çalıştır