Q-Ağını Örneklendirme
Artık mimarisini tanımladığına göre, ajanının kullanacağı gerçek ağı ve onun optimize edicisini oluşturabilirsin. Lunar Lander ortamının durum uzayı boyutu 8, eylem uzayı boyutu ise 4'tür (0: hiçbir şey yapma, 1: sol itici, 2: ana motor, 3: sağ itici).
Önceki egzersizde yazdığın QNetwork sınıfı kullanımına hazır.
Bu egzersiz
Python ile Deep Reinforcement Learning
kursunun bir parçasıdırEgzersiz talimatları
- Lunar Lander ortamı için bir Q Ağı oluştur.
- Sinir ağı için Adam optimize edicisini tanımla ve öğrenme oranını 0.0001 olarak belirt.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
state_size = 8
action_size = 4
# Instantiate the Q Network
q_network = QNetwork(____, ____)
# Specify the optimizer learning rate
optimizer = optim.Adam(q_network.parameters(), ____)
print("Q-Network initialized as:\n", q_network)