RL etkileşim döngüsü
Artık bildiğin gibi, RL bir ajanın bir ortamda kümülatif ödülü en üst düzeye çıkarmak için kararlar vermesini içerir. Ajan, hangi eylemlerin en fazla ödül getirdiğini etkileşim yoluyla keşfetmelidir.
Bu egzersiz, kursun bir parçasıdır
Python ile Gymnasium'da Reinforcement Learning
Uygulamalı etkileşimli egzersiz
Teoriyi etkileşime dönüştürün, interaktif egzersizlerimizden biriyle
Egzersize başla