Évaluer le RLHF avec des métriques
Vous entraînez un modèle avec du reinforcement learning with human feedback (RLHF) et devez évaluer ses performances à l’aide de métriques adaptées.
Laquelle des options suivantes convient le mieux pour évaluer une tâche de synthèse à l’aide de métriques automatisées ?
Vous pouvez visualiser les données dans la console pour vous aider à choisir les métriques les plus adaptées à la tâche. Les données à évaluer ont été préchargées dans un DataFrame nommé df_evaluation.
Cet exercice fait partie du cours
Reinforcement Learning from Human Feedback (RLHF)
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice