ComenzarEmpieza gratis

Interpretar curvas

Estás evaluando un modelo usando curvas de aprendizaje y métricas de rendimiento a lo largo de varias épocas de entrenamiento. ¿Qué indica una curva de pérdida KL relativamente estable sobre tu modelo?

Este ejercicio forma parte del curso

Reinforcement Learning from Human Feedback (RLHF)

Ver curso

Ejercicio interactivo práctico

Pon en práctica la teoría con uno de nuestros ejercicios interactivos

Empezar ejercicio