Similarità tra Doc con spaCy
La similarità semantica consiste nell'analizzare più frasi per identificarne le somiglianze. In questo esercizio metterai in pratica il calcolo della similarità semantica di documenti rispetto a un documento dato. L'obiettivo è categorizzare un elenco di recensioni pertinenti a canned dog food.
La categoria canned dog food è salvata in category. Un campione di cinque recensioni di prodotti alimentari è stato fornito in una lista chiamata texts. en_core_web_md è caricato come nlp.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Crea una lista
documentsche contenga i contenitoriDocdi tutti itexts. - Crea un contenitore
Docdicategorye salvalo comecategory_document. - Itera su
documentse stampa i punteggi di similarità di ciascun contenitoreDocconcategory_document, arrotondati a tre cifre.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))