CommencerCommencez gratuitement

Interpréter des courbes

Vous évaluez un modèle à l’aide de courbes d’apprentissage et de métriques de performance sur plusieurs époques d’entraînement. Que révèle une courbe de perte KL relativement stable à propos de votre modèle ?

Cet exercice fait partie du cours

<cours>Reinforcement Learning from Human Feedback (RLHF)</cours>
Voir le cours

Exercice interactif pratique

Transformez la théorie en action avec l’un de nos exercices interactifs

Commencer l’exercice