BaşlayınÜcretsiz Başlayın

Q-Ağını Örneklendirme

Artık mimarisini tanımladığına göre, ajanının kullanacağı gerçek ağı ve onun optimize edicisini oluşturabilirsin. Lunar Lander ortamının durum uzayı boyutu 8, eylem uzayı boyutu ise 4'tür (0: hiçbir şey yapma, 1: sol itici, 2: ana motor, 3: sağ itici).

Önceki egzersizde yazdığın QNetwork sınıfı kullanımına hazır.

Bu egzersiz

Python ile Deep Reinforcement Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • Lunar Lander ortamı için bir Q Ağı oluştur.
  • Sinir ağı için Adam optimize edicisini tanımla ve öğrenme oranını 0.0001 olarak belirt.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

state_size = 8
action_size = 4
# Instantiate the Q Network
q_network = QNetwork(____, ____)
# Specify the optimizer learning rate
optimizer = optim.Adam(q_network.parameters(), ____)

print("Q-Network initialized as:\n", q_network)
Kodu Düzenle ve Çalıştır