Komponen MDP Frozen Lake Kustom
Lingkungan grid world yang disediakan merupakan variasi dari lingkungan Frozen Lake, di mana sebuah agen harus menuju tujuan sambil menghindari lubang. Tugas Anda adalah menganalisis lingkungan ini dan merumuskannya sebagai sebuah MDP dengan menjawab pertanyaan-pertanyaan tertentu.
Anda dapat mencoba menjawab dengan menginspeksi lingkungan secara visual, jika relevan, atau dengan memanfaatkan variabel env yang telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reinforcement Learning dengan Gymnasium di Python
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga