Loop interaksi RL
Sejauh ini Anda telah mengetahui bahwa RL melibatkan agen yang membuat keputusan dalam suatu lingkungan untuk memaksimalkan gagasan tentang hadiah kumulatif. Agen harus menemukan aksi mana yang menghasilkan hadiah terbesar melalui interaksi.
Latihan ini adalah bagian dari kursus
Reinforcement Learning dengan Gymnasium di Python
Latihan interaktif praktis
Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.
Mulai berolahraga