Komponen MDP Frozen Lake Kustom
Lingkungan grid world yang disediakan merupakan variasi dari lingkungan Frozen Lake, di mana sebuah agen harus menuju tujuan sambil menghindari lubang. Tugas Anda adalah menganalisis lingkungan ini dan merumuskannya sebagai sebuah MDP dengan menjawab pertanyaan-pertanyaan tertentu.
Anda dapat mencoba menjawab dengan menginspeksi lingkungan secara visual, jika relevan, atau dengan memanfaatkan variabel env yang telah dimuat untuk Anda.
Latihan ini merupakan bagian dari kursus
Reinforcement Learning dengan Gymnasium di Python
Latihan interaktif langsung
Ubah teori menjadi aksi dengan salah satu latihan interaktif kami
Mulai latihan