Doc-Ähnlichkeit mit spaCy
Semantische Ähnlichkeit bedeutet, mehrere Sätze zu analysieren, um Gemeinsamkeiten zwischen ihnen zu erkennen. In dieser Übung berechnest du die semantische Ähnlichkeit von Dokumenten mit einem gegebenen Dokument. Das Ziel ist, eine Liste von Bewertungen zu kategorisieren, die für Dosenhundefutter relevant sind.
Die Kategorie Dosenhundefutter ist in category gespeichert. Eine Stichprobe von fünf Lebensmittelbewertungen findest du in der Liste texts. en_core_web_md ist als nlp geladen.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Anleitung zur Übung
- Erstelle eine Liste
documents, dieDoc-Container allertextsenthält. - Erstelle einen
Doc-Container auscategoryund speichere ihn alscategory_document. - Iteriere über
documentsund gib die Ähnlichkeitswerte jedesDoc-Containers mit demcategory_documentaus, auf drei Nachkommastellen gerundet.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a documents list containing Doc containers
documents = [____ for t in texts]
# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)
# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))