IniziaInizia gratis

Similarità tra Doc con spaCy

La similarità semantica consiste nell'analizzare più frasi per identificarne le somiglianze. In questo esercizio metterai in pratica il calcolo della similarità semantica di documenti rispetto a un documento dato. L'obiettivo è categorizzare un elenco di recensioni pertinenti a canned dog food.

La categoria canned dog food è salvata in category. Un campione di cinque recensioni di prodotti alimentari è stato fornito in una lista chiamata texts. en_core_web_md è caricato come nlp.

Questo esercizio fa parte del corso

Natural Language Processing con spaCy

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una lista documents che contenga i contenitori Doc di tutti i texts.
  • Crea un contenitore Doc di category e salvalo come category_document.
  • Itera su documents e stampa i punteggi di similarità di ciascun contenitore Doc con category_document, arrotondati a tre cifre.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Modifica ed esegui il codice