1. Learn
  2. /
  3. 课程
  4. /
  5. Introduktion till LLM:er i Python

Connected

道练习

Använda evaluate-mått

Nu är det dags att utvärdera din LLM som klassificerar kundtjänstinteraktioner. Du fortsätter där du slutade med din finjusterade modell och använder nu ett nytt valideringsdataset för att bedöma modellens prestanda.

Ett antal interaktioner och deras motsvarande etiketter har laddats in åt dig som validate_text och validate_labels. model och tokenizer är också inlästa.

说明

100 XP
  • Extrahera de förutsagda etiketterna från modellens logits i outputs.
  • Beräkna de fyra inlästa måtten genom att jämföra de verkliga etiketterna (validate_labels) med de förutsagda.