Rede on-line e rede de destino em DDQN
Em Double DQN, assim como em DQN com alvos Q fixos, há duas redes neurais em jogo: a rede on-line e a rede de alvos. É importante entender suas respectivas finalidades e a função que desempenham no ciclo de treinamento do DDQN.
Este exercicio faz parte do curso
Aprendizado por reforço profundo em Python
exercicio interativo prático
Transforme teoria em prática com um dos nossos exercicio interativos
Iniciar exercicio