Jaringan online dan jaringan target dalam DDQN
Dalam Double DQN, seperti pada DQN dengan Q-target tetap, ada dua jaringan saraf yang digunakan: jaringan online dan jaringan target. Penting untuk memahami tujuan masing-masing dan peran yang dijalankan dalam loop pelatihan DDQN.
Latihan ini adalah bagian dari kursus
Deep Reinforcement Learning dengan Python
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga