Mulai sekarangMulai gratis

Loop interaksi RL

Sejauh ini Anda telah mengetahui bahwa RL melibatkan agen yang membuat keputusan dalam suatu lingkungan untuk memaksimalkan gagasan tentang hadiah kumulatif. Agen harus menemukan aksi mana yang menghasilkan hadiah terbesar melalui interaksi.

Latihan ini merupakan bagian dari kursus

Reinforcement Learning dengan Gymnasium di Python

Lihat Kursus

Latihan interaktif langsung

Ubah teori menjadi aksi dengan salah satu latihan interaktif kami

Mulai latihan