Extraire les prompts
Vous travaillez avec le jeu de données hendrydong/rlhf_helpful_eval, qui contient des dialogues entre un utilisateur (Human) et un assistant (Assistant). Votre objectif est de nettoyer le texte afin d’obtenir un prompt épuré, où seul le texte pertinent apparaît, sans schémas ni balises spécifiques.
Choisissez l’option que vous utiliseriez pour nettoyer le jeu de données et extraire les prompts. Vous pouvez afficher un extrait du jeu de données en exécutant le code suivant dans la console :
evaluation_data.iloc[range(1)]['text'][0]
Cet exercice fait partie du cours
<cours>Reinforcement Learning from Human Feedback (RLHF)</cours>Exercice interactif pratique
Transformez la théorie en action avec l’un de nos exercices interactifs
Commencer l’exercice