1. Learn
  2. /
  3. Courses
  4. /
  5. Wprowadzenie do LLM w Pythonie

Connected

Exercise

Ewaluacja z użyciem ROUGE

ROUGE jest często stosowana do oceny zadań streszczania – sprawdza podobieństwa między przewidywaniami a tekstami referencyjnymi. Masz do dyspozycji streszczenie wygenerowane przez model (predictions) oraz streszczenie referencyjne (references) do walidacji. Oblicz wyniki, aby sprawdzić, jak dobrze poradził sobie model.

Biblioteka evaluate została już dla ciebie wczytana.

Instructions

100 XP
  • Wczytaj metrykę ROUGE.
  • Oblicz wyniki ROUGE między przewidywanym a referencyjnym streszczeniem.