CommencerCommencer gratuitement

Évaluer le RLHF avec des métriques

Vous entraînez un modèle avec du reinforcement learning with human feedback (RLHF) et devez évaluer ses performances à l’aide de métriques adaptées.

Laquelle des options suivantes convient le mieux pour évaluer une tâche de synthèse à l’aide de métriques automatisées ?

Vous pouvez visualiser les données dans la console pour vous aider à choisir les métriques les plus adaptées à la tâche. Les données à évaluer ont été préchargées dans un DataFrame nommé df_evaluation.

Cet exercice fait partie du cours

Reinforcement Learning from Human Feedback (RLHF)

Afficher le cours

Exercice interactif pratique

Passez de la théorie à la pratique avec l’un de nos exercices interactifs

Commencer l’exercice