Mulai sekarangMulai gratis

Berinteraksi dengan environment Frozen Lake

Sekarang Anda akan menavigasi environment Frozen Lake, sebuah dunia berbentuk kisi (grid) di mana aksi menggerakkan agen ke arah tertentu. Tugas Anda adalah mengamati environment dengan saksama, lalu mendefinisikan secara manual daftar actions yang akan menavigasikan agen dari titik awal (kiri atas) ke tujuan (kanan bawah) tanpa terperosok ke lubang mana pun. Dalam environment Frozen Lake, aksi umumnya direpresentasikan sebagai:

  • 0: kiri
  • 1: bawah
  • 2: kanan
  • 3: atas

Setelah menjalankan kode Anda, pastikan untuk menelusuri plot Anda guna melihat jalur yang diambil dengan menggunakan tombol 'Previous Plot' dan 'Next Plot'. Ini akan membantu Anda memahami urutan aksi dan hasilnya.

gym dan plt telah diimpor bersama dengan fungsi render() dan variabel env.

Latihan ini merupakan bagian dari kursus

Reinforcement Learning dengan Gymnasium di Python

Lihat Kursus

Instruksi latihan

  • Amati posisi agen di sisi kanan dan definisikan daftar actions untuk menavigasikan agen melintasi danau hingga mencapai tujuan.
  • Eksekusikan setiap aksi dalam daftar melalui perulangan for.
  • Render environment setelah setiap aksi untuk mengamati jalur agen.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Define the sequence of actions
actions = [____]

for action in actions:
  # Execute each action
  state, reward, terminated, _, _ = ____
  # Render the environment
  ____
  if terminated:
  	print("You reached the goal!")
Edit dan Jalankan Kode