LoslegenKostenlos loslegen

Span-Ähnlichkeit mit spaCy

Semantische Ähnlichkeit kann dir helfen, Texte vordefinierten Kategorien zuzuordnen, relevante Texte zu erkennen oder doppelte Inhalte zu markieren. In dieser Übung berechnest du die semantische Ähnlichkeit von Spans eines Dokuments zu einem gegebenen Dokument. Das Ziel ist, den relevantesten Span aus drei Tokens zu finden, der zu canned dog food passt.

Die Kategorie canned dog food ist in category gespeichert. Ein Textstring ist bereits im Objekt text abgelegt und en_core_web_md ist als nlp geladen. Der Doc-Container von text ist ebenfalls schon erstellt und in document gespeichert.

Diese Übung ist Teil des Kurses

Natural Language Processing mit spaCy

Kurs anzeigen

Anleitung zur Übung

  • Erstelle einen Doc-Container für category und speichere ihn in category_document.
  • Gib den Ähnlichkeitswert eines gegebenen Span und des category_document aus, auf drei Stellen gerundet.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)

# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))
Code bearbeiten und ausführen