Interpreting curves
You are evaluating a model using learning curves and performance metrics over several training epochs. What does a relatively stable KL loss curve indicate about your model?
Este ejercicio forma parte del curso
Reinforcement Learning from Human Feedback (RLHF)
Ejercicio interactivo práctico
Pon en práctica la teoría con uno de nuestros ejercicios interactivos
