Mengeksplorasi ruang state dan aksi
Lingkungan Cliff Walking melibatkan sebuah agen yang menyeberangi dunia kisi dari titik awal ke tujuan sambil menghindari terjatuh dari tebing. Jika pemain bergerak ke lokasi tebing, ia akan kembali ke lokasi awal. Pemain terus bergerak hingga mencapai tujuan, yang mengakhiri episode. Tugas Anda adalah mengeksplorasi ruang state dan aksi dari lingkungan ini.

Latihan ini merupakan bagian dari kursus
Reinforcement Learning dengan Gymnasium di Python
Instruksi latihan
- Buat instance lingkungan untuk Cliff Walking dengan ID lingkungan
CliffWalking. - Hitung ukuran ruang aksi dan simpan dalam
num_actions. - Hitung ukuran ruang state dan simpan dalam
num_states.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create the Cliff Walking environment
env = ____
# Compute the size of the action space
num_actions = ____
# Compute the size of the state space
num_states = ____
print("Number of actions:", num_actions)
print("Number of states:", num_states)