Mengeksplorasi ruang state dan aksi
Lingkungan Cliff Walking melibatkan sebuah agen yang menyeberangi dunia kisi dari titik awal ke tujuan sambil menghindari terjatuh dari tebing. Jika pemain bergerak ke lokasi tebing, ia akan kembali ke lokasi awal. Pemain terus bergerak hingga mencapai tujuan, yang mengakhiri episode. Tugas Anda adalah mengeksplorasi ruang state dan aksi dari lingkungan ini.

Latihan ini adalah bagian dari kursus
Reinforcement Learning dengan Gymnasium di Python
Petunjuk latihan
- Buat instance lingkungan untuk Cliff Walking dengan ID lingkungan
CliffWalking. - Hitung ukuran ruang aksi dan simpan dalam
num_actions. - Hitung ukuran ruang state dan simpan dalam
num_states.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the Cliff Walking environment
env = ____
# Compute the size of the action space
num_actions = ____
# Compute the size of the state space
num_states = ____
print("Number of actions:", num_actions)
print("Number of states:", num_states)