Loop interaksi RL
Sejauh ini Anda telah mengetahui bahwa RL melibatkan agen yang membuat keputusan dalam suatu lingkungan untuk memaksimalkan gagasan tentang hadiah kumulatif. Agen harus menemukan aksi mana yang menghasilkan hadiah terbesar melalui interaksi.
Latihan ini merupakan bagian dari kursus
Reinforcement Learning dengan Gymnasium di Python
Latihan interaktif langsung
Ubah teori menjadi aksi dengan salah satu latihan interaktif kami
Mulai latihan