Interpréter des courbes
Vous évaluez un modèle à l’aide de courbes d’apprentissage et de métriques de performance sur plusieurs époques d’entraînement. Que révèle une courbe de perte KL relativement stable à propos de votre modèle ?
Cet exercice fait partie du cours
Reinforcement Learning from Human Feedback (RLHF)
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice