LoslegenKostenlos loslegen

Doc-Ähnlichkeit mit spaCy

Semantische Ähnlichkeit bedeutet, mehrere Sätze zu analysieren, um Gemeinsamkeiten zwischen ihnen zu erkennen. In dieser Übung berechnest du die semantische Ähnlichkeit von Dokumenten mit einem gegebenen Dokument. Das Ziel ist, eine Liste von Bewertungen zu kategorisieren, die für Dosenhundefutter relevant sind.

Die Kategorie Dosenhundefutter ist in category gespeichert. Eine Stichprobe von fünf Lebensmittelbewertungen findest du in der Liste texts. en_core_web_md ist als nlp geladen.

Diese Übung ist Teil des Kurses

Natural Language Processing mit spaCy

Kurs anzeigen

Anleitung zur Übung

  • Erstelle eine Liste documents, die Doc-Container aller texts enthält.
  • Erstelle einen Doc-Container aus category und speichere ihn als category_document.
  • Iteriere über documents und gib die Ähnlichkeitswerte jedes Doc-Containers mit dem category_document aus, auf drei Nachkommastellen gerundet.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a documents list containing Doc containers
documents = [____ for t in texts]

# Create a Doc container of the category
category = "canned dog food"
category_document = ____(____)

# Print similarity scores of each Doc container and the category_document
for i, doc in enumerate(documents):
  print(f"Semantic similarity with document {i+1}:", round(doc.____(____), 3))
Code bearbeiten und ausführen