LoslegenKostenlos starten

Span-Ähnlichkeit mit spaCy

Semantische Ähnlichkeit kann dir helfen, Texte vordefinierten Kategorien zuzuordnen, relevante Texte zu erkennen oder doppelte Inhalte zu markieren. In dieser Übung berechnest du die semantische Ähnlichkeit von Spans eines Dokuments zu einem gegebenen Dokument. Das Ziel ist, den relevantesten Span aus drei Tokens zu finden, der zu canned dog food passt.

Die Kategorie canned dog food ist in category gespeichert. Ein Textstring ist bereits im Objekt text abgelegt und en_core_web_md ist als nlp geladen. Der Doc-Container von text ist ebenfalls schon erstellt und in document gespeichert.

Diese Übung ist Teil des Kurses

<Kurs>Natural Language Processing mit spaCy</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle einen Doc-Container für category und speichere ihn in category_document.
  • Gib den Ähnlichkeitswert eines gegebenen Span und des category_document aus, auf drei Stellen gerundet.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)

# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))
Code bearbeiten und ausführen