Rede on-line e rede de destino em DDQN
Em Double DQN, assim como em DQN com alvos Q fixos, há duas redes neurais em jogo: a rede on-line e a rede de alvos. É importante entender suas respectivas finalidades e a função que desempenham no ciclo de treinamento do DDQN.
Este exercício faz parte do curso
Aprendizado por reforço profundo em Python
Exercício interativo prático
Transforme a teoria em ação com um de nossos exercícios interativos
