Inizia subitoInizia gratis

Componenti personalizzati dell'MDP Frozen Lake

L'ambiente grid world fornito è una variante di Frozen Lake in cui un agente deve raggiungere l'obiettivo evitando le buche. Il tuo compito è analizzare questo ambiente e incorniciarlo come un MDP rispondendo a domande specifiche.

Puoi provare a rispondere ispezionando visivamente l'ambiente, quando possibile, oppure utilizzando la variabile env già caricata per te.

Questo esercizio fa parte del corso

Reinforcement Learning con Gymnasium in Python

Visualizza corso

esercizio interattivo pratico

Trasforma la teoria in pratica con uno dei nostri esercizi interattivi

Inizia esercizio