IniziaInizia gratis

Componenti personalizzati dell'MDP Frozen Lake

L'ambiente grid world fornito è una variante di Frozen Lake in cui un agente deve raggiungere l'obiettivo evitando le buche. Il tuo compito è analizzare questo ambiente e incorniciarlo come un MDP rispondendo a domande specifiche.

Puoi provare a rispondere ispezionando visivamente l'ambiente, quando possibile, oppure utilizzando la variabile env già caricata per te.

Questo esercizio fa parte del corso

Reinforcement Learning con Gymnasium in Python

Visualizza il corso

Esercizio pratico interattivo

Passa dalla teoria alla pratica con uno dei nostri esercizi interattivi

Inizia esercizio