Performanța modelului pe datele tale

În acest exercițiu, vei exersa evaluarea unui model existent pe propriile date. Scopul este să analizezi performanța modelului pentru o etichetă specifică de entitate, PRODUCT. Dacă un model clasifică corect un procent mare de entități PRODUCT (de exemplu, mai mult de 75%), nu este necesar să antrenezi modelul pe exemple de entități PRODUCT. În caz contrar, ar trebui să iei în considerare antrenarea modelului pentru a-i îmbunătăți performanța la predicția entităților PRODUCT.

Vei folosi două recenzii din setul de date Amazon Fine Food Reviews. Poți accesa aceste recenzii prin lista texts.

Modelul en_core_web_sm este deja încărcat. Îl poți folosi apelând nlp(). Modelul a fost deja rulat pe lista texts, iar documents – o listă de containere Doc – este disponibilă pentru utilizare.

Construiește o listă target_entities cu toate entitățile din fiecare document din documents și adaugă un tuplu (textul entității, eticheta entității) doar dacă Jumbo se află în textul entității.
Pentru fiecare tuplu din target_entities, adaugă True într-o listă correct_labels dacă eticheta entității (al doilea element din tuplu) este PRODUCT, altfel adaugă False.

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}exercițiu

Instrucțiuni

exercițiu