Somiglianza tra span con spaCy
Determinare la similarità semantica può aiutarti a categorizzare i testi in categorie predefinite, a rilevare testi pertinenti o a segnalare contenuti duplicati. In questo esercizio, farai pratica calcolando la similarità semantica di porzioni (span) di un documento rispetto a un documento dato. L’obiettivo è trovare lo Span di tre token più pertinente rispetto a canned dog food.
La categoria canned dog food è salvata in category. Una stringa di testo è già memorizzata nell’oggetto text e en_core_web_md è caricato come nlp. Il contenitore Doc di text è già stato creato e salvato in document.
Questo esercizio fa parte del corso
Natural Language Processing con spaCy
Istruzioni dell'esercizio
- Crea un contenitore
Docpercategorye salvalo incategory_document. - Stampa il punteggio di similarità tra uno
Spandato ecategory_document, arrotondato a tre cifre.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)
# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))