Similarità tra Doc con spaCy

La similarità semantica consiste nell'analizzare più frasi per identificarne le somiglianze. In questo esercizio metterai in pratica il calcolo della similarità semantica di documenti rispetto a un documento dato. L'obiettivo è categorizzare un elenco di recensioni pertinenti a canned dog food.

La categoria canned dog food è salvata in category. Un campione di cinque recensioni di prodotti alimentari è stato fornito in una lista chiamata texts. en_core_web_md è caricato come nlp.

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza corso

Istruzioni dell'esercizio

Crea una lista documents che contenga i contenitori Doc di tutti i texts.
Crea un contenitore Doc di category e salvalo come category_document.
Itera su documents e stampa i punteggi di similarità di ciascun contenitore Doc con category_document, arrotondati a tre cifre.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))

Modifica ed esegui il codice