1. Learn
  2. /
  3. Курси
  4. /
  5. Introduction aux LLM avec Python

Connected

вправа

Évaluer avec ROUGE

ROUGE est souvent utilisé pour évaluer les tâches de synthèse, car il vérifie les similarités entre les prédictions et les références. On vous a fourni un résumé généré par le modèle, predictions, ainsi qu'un résumé de references pour la validation. Calculez les scores pour voir la performance du modèle.

La bibliothèque evaluate a été chargée pour vous.

Інструкції

100 XP
  • Chargez la mesure ROUGE.
  • Calculez les scores ROUGE entre les résumés prédit et de référence.