Berinteraksi dengan environment Frozen Lake
Sekarang Anda akan menavigasi environment Frozen Lake, sebuah dunia berbentuk kisi (grid) di mana aksi menggerakkan agen ke arah tertentu. Tugas Anda adalah mengamati environment dengan saksama, lalu mendefinisikan secara manual daftar actions yang akan menavigasikan agen dari titik awal (kiri atas) ke tujuan (kanan bawah) tanpa terperosok ke lubang mana pun. Dalam environment Frozen Lake, aksi umumnya direpresentasikan sebagai:
- 0: kiri
- 1: bawah
- 2: kanan
- 3: atas
Setelah menjalankan kode Anda, pastikan untuk menelusuri plot Anda guna melihat jalur yang diambil dengan menggunakan tombol 'Previous Plot' dan 'Next Plot'. Ini akan membantu Anda memahami urutan aksi dan hasilnya.
gym dan plt telah diimpor bersama dengan fungsi render() dan variabel env.
Latihan ini adalah bagian dari kursus
Reinforcement Learning dengan Gymnasium di Python
Petunjuk latihan
- Amati posisi agen di sisi kanan dan definisikan daftar
actionsuntuk menavigasikan agen melintasi danau hingga mencapai tujuan. - Eksekusikan setiap aksi dalam daftar melalui perulangan
for. - Render environment setelah setiap aksi untuk mengamati jalur agen.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Define the sequence of actions
actions = [____]
for action in actions:
# Execute each action
state, reward, terminated, _, _ = ____
# Render the environment
____
if terminated:
print("You reached the goal!")