Online netwerk en targetnetwerk in DDQN
In Double DQN, net als in DQN met vaste Q-doelen, zijn er twee neurale netwerken in het spel: het online netwerk en het targetnetwerk. Het is belangrijk om hun respectieve doelen te begrijpen en de rol die ze spelen in de DDQN-trainingslus.
Deze oefening maakt deel uit van de cursus
Deep Reinforcement Learning in Python
Praktische interactieve oefening
Zet theorie om in actie met een van onze interactieve oefeningen.
Begin met trainen