Componentes personalizados del MDP de Frozen Lake
El entorno de grid world que se te proporciona es una variación de Frozen Lake, donde un agente debe llegar a una meta evitando caer en agujeros. Tu tarea es analizar este entorno y formularlo como un MDP respondiendo a preguntas concretas.
Puedes intentar responder inspeccionando visualmente el entorno, cuando aplique, o utilizando la variable env que ya está precargada para ti.
Este ejercicio forma parte del curso
Reinforcement Learning con Gymnasium en Python
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
Empezar ejercicio