Mulai sekarangMulai gratis

Komponen MDP Frozen Lake Kustom

Lingkungan grid world yang disediakan merupakan variasi dari lingkungan Frozen Lake, di mana sebuah agen harus menuju tujuan sambil menghindari lubang. Tugas Anda adalah menganalisis lingkungan ini dan merumuskannya sebagai sebuah MDP dengan menjawab pertanyaan-pertanyaan tertentu.

Anda dapat mencoba menjawab dengan menginspeksi lingkungan secara visual, jika relevan, atau dengan memanfaatkan variabel env yang telah dimuat untuk Anda.

Latihan ini merupakan bagian dari kursus

Reinforcement Learning dengan Gymnasium di Python

Lihat Kursus

Latihan interaktif langsung

Ubah teori menjadi aksi dengan salah satu latihan interaktif kami

Mulai latihan