MulaiMulai sekarang secara gratis

Loop interaksi RL

Sejauh ini Anda telah mengetahui bahwa RL melibatkan agen yang membuat keputusan dalam suatu lingkungan untuk memaksimalkan gagasan tentang hadiah kumulatif. Agen harus menemukan aksi mana yang menghasilkan hadiah terbesar melalui interaksi.

Latihan ini adalah bagian dari kursus

Reinforcement Learning dengan Gymnasium di Python

Lihat Kursus

Latihan interaktif praktis

Ubah teori menjadi tindakan dengan salah satu latihan interaktif kami.

Mulai berolahraga