1. Learn
  2. /
  3. Cursuri
  4. /
  5. Introducere în LLM-uri cu Python

Connected

exercițiu

Evaluare cu ROUGE

ROUGE este folosit frecvent pentru evaluarea sarcinilor de sumarizare, deoarece verifică similaritățile dintre predicții și referințe. Ți-au fost furnizate un rezumat generat de model, predictions, și un rezumat de referință, references, pentru validare. Calculează scorurile pentru a vedea cât de bine a performant modelul.

Biblioteca evaluate a fost deja încărcată pentru tine.

Instrucțiuni

100 XP
  • Încarcă metrica ROUGE.
  • Calculează scorurile ROUGE dintre rezumatul prezis și cel de referință.