Comprendre la comparaison et l’évaluation en RLHF
À vous de jouer. Imaginez que vous concevez un assistant IA et devez mesurer la satisfaction des utilisateurs. Vous envisagez de collecter des retours basés sur la comparaison ou, alternativement, sur des évaluations. Mais quelles sont les différences entre les deux ? Chaque méthode a ses spécificités, et choisir la bonne peut fortement influencer le succès de votre produit.
Cet exercice fait partie du cours
Reinforcement Learning from Human Feedback (RLHF)
Exercice interactif pratique
Passez de la théorie à la pratique avec l’un de nos exercices interactifs
Commencer l’exercice