1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Reinforcement Learning with Gymnasium in Python

Connected

Cvičení

Řešení prostředí Frozen Lake 8x8 pomocí SARSA

V tomto cvičení použiješ algoritmus SARSA spolu s funkcí update_q_table(), kterou jsi implementoval/a v předchozím cvičení, a naučíš agenta optimální strategii pro prostředí Frozen Lake 8x8. Toto prostředí je totožné s klasickou verzí 4x4, liší se pouze větší plochou. Pomocí algoritmu SARSA budeš postupně zlepšovat agentovu strategii na základě odměn získaných z prostředí.

Q-tabulka Q je již inicializována a připravena, stejně jako funkce update_q_table() z předchozího cvičení.

Pokyny

100 XP
  • Pro každou epizodu v procesu trénování proveď vybranou akci action.
  • Zvol next_action náhodně.
  • Aktualizuj Q-tabulku pro daný state a action.