Somiglianza tra span con spaCy

Determinare la similarità semantica può aiutarti a categorizzare i testi in categorie predefinite, a rilevare testi pertinenti o a segnalare contenuti duplicati. In questo esercizio, farai pratica calcolando la similarità semantica di porzioni (span) di un documento rispetto a un documento dato. L’obiettivo è trovare lo Span di tre token più pertinente rispetto a canned dog food.

La categoria canned dog food è salvata in category. Una stringa di testo è già memorizzata nell’oggetto text e en_core_web_md è caricato come nlp. Il contenitore Doc di text è già stato creato e salvato in document.

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza corso

Istruzioni dell'esercizio

Crea un contenitore Doc per category e salvalo in category_document.
Stampa il punteggio di similarità tra uno Span dato e category_document, arrotondato a tre cifre.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)

# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))

Modifica ed esegui il codice