1. Learn
  2. /
  3. Cursuri
  4. /
  5. Procesarea limbajului natural cu spaCy

Connected

exercițiu

Performanța modelului pe datele tale

În acest exercițiu, vei exersa evaluarea unui model existent pe propriile date. Scopul este să analizezi performanța modelului pentru o etichetă specifică de entitate, PRODUCT. Dacă un model clasifică corect un procent mare de entități PRODUCT (de exemplu, mai mult de 75%), nu este necesar să antrenezi modelul pe exemple de entități PRODUCT. În caz contrar, ar trebui să iei în considerare antrenarea modelului pentru a-i îmbunătăți performanța la predicția entităților PRODUCT.

Vei folosi două recenzii din setul de date Amazon Fine Food Reviews. Poți accesa aceste recenzii prin lista texts.

Modelul en_core_web_sm este deja încărcat. Îl poți folosi apelând nlp(). Modelul a fost deja rulat pe lista texts, iar documents – o listă de containere Doc – este disponibilă pentru utilizare.

Instrucțiuni

100 XP
  • Construiește o listă target_entities cu toate entitățile din fiecare document din documents și adaugă un tuplu (textul entității, eticheta entității) doar dacă Jumbo se află în textul entității.
  • Pentru fiecare tuplu din target_entities, adaugă True într-o listă correct_labels dacă eticheta entității (al doilea element din tuplu) este PRODUCT, altfel adaugă False.