MulaiMulai sekarang secara gratis

Menginstansiasi Q-Network

Sekarang setelah Anda mendefinisikan arsitekturnya, Anda siap untuk menginstansiasi jaringan sebenarnya yang akan digunakan agen Anda, beserta optimizernya. Lingkungan Lunar Lander memiliki ruang keadaan berdimensi 8 dan ruang aksi berdimensi 4 (masing-masing sesuai dengan 0: tidak melakukan apa pun, 1: pendorong kiri, 2: mesin utama, 3: pendorong kanan).

Kelas QNetwork dari latihan sebelumnya tersedia untuk Anda.

Latihan ini adalah bagian dari kursus

Deep Reinforcement Learning dengan Python

Lihat Kursus

Petunjuk latihan

  • Instansiasikan sebuah Q Network untuk lingkungan Lunar Lander.
  • Definisikan optimizer Adam untuk jaringan saraf, dengan laju pembelajaran 0,0001.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

state_size = 8
action_size = 4
# Instantiate the Q Network
q_network = QNetwork(____, ____)
# Specify the optimizer learning rate
optimizer = optim.Adam(q_network.parameters(), ____)

print("Q-Network initialized as:\n", q_network)
Edit dan Jalankan Kode