ComenzarEmpieza gratis

Componentes personalizados del MDP de Frozen Lake

El entorno de grid world que se te proporciona es una variación de Frozen Lake, donde un agente debe llegar a una meta evitando caer en agujeros. Tu tarea es analizar este entorno y formularlo como un MDP respondiendo a preguntas concretas.

Puedes intentar responder inspeccionando visualmente el entorno, cuando aplique, o utilizando la variable env que ya está precargada para ti.

Este ejercicio forma parte del curso

Reinforcement Learning con Gymnasium en Python

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio