Évaluation avec METEOR
METEOR excelle dans l'évaluation de certaines des caractéristiques sémantiques les plus complexes du texte. Il fonctionne de manière similaire à ROUGE en comparant une sortie générée par un modèle à une sortie de référence. Ces textes vous ont été fournis comme generated et reference. Il vous appartient d'évaluer le score.
La bibliothèque evaluate a été chargée pour vous.
Cet exercice fait partie du cours
Introduction aux LLM en Python
Instructions
- Calculez et affichez le score METEOR.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
meteor = evaluate.load("meteor")
generated = ["The burrow stretched forward like a narrow corridor for a while, then plunged abruptly downward, so quickly that Alice had no chance to stop herself before she was tumbling into an extremely deep shaft."]
reference = ["The rabbit-hole went straight on like a tunnel for some way, and then dipped suddenly down, so suddenly that Alice had not a moment to think about stopping herself before she found herself falling down a very deep well."]
# Compute and print the METEOR score
results = ____
print("Meteor: ", ____)