Span-Ähnlichkeit mit spaCy
Semantische Ähnlichkeit kann dir helfen, Texte vordefinierten Kategorien zuzuordnen, relevante Texte zu erkennen oder doppelte Inhalte zu markieren. In dieser Übung berechnest du die semantische Ähnlichkeit von Spans eines Dokuments zu einem gegebenen Dokument. Das Ziel ist, den relevantesten Span aus drei Tokens zu finden, der zu canned dog food passt.
Die Kategorie canned dog food ist in category gespeichert. Ein Textstring ist bereits im Objekt text abgelegt und en_core_web_md ist als nlp geladen. Der Doc-Container von text ist ebenfalls schon erstellt und in document gespeichert.
Diese Übung ist Teil des Kurses
<Kurs>Natural Language Processing mit spaCy</Kurs>Übungsanweisungen
- Erstelle einen
Doc-Container fürcategoryund speichere ihn incategory_document. - Gib den Ähnlichkeitswert eines gegebenen
Spanund descategory_documentaus, auf drei Stellen gerundet.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)
# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))