Span-Ähnlichkeit mit spaCy
Semantische Ähnlichkeit kann dir helfen, Texte vordefinierten Kategorien zuzuordnen, relevante Texte zu erkennen oder doppelte Inhalte zu markieren. In dieser Übung berechnest du die semantische Ähnlichkeit von Spans eines Dokuments zu einem gegebenen Dokument. Das Ziel ist, den relevantesten Span aus drei Tokens zu finden, der zu canned dog food passt.
Die Kategorie canned dog food ist in category gespeichert. Ein Textstring ist bereits im Objekt text abgelegt und en_core_web_md ist als nlp geladen. Der Doc-Container von text ist ebenfalls schon erstellt und in document gespeichert.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Anleitung zur Übung
- Erstelle einen
Doc-Container fürcategoryund speichere ihn incategory_document. - Gib den Ähnlichkeitswert eines gegebenen
Spanund descategory_documentaus, auf drei Stellen gerundet.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Create a Doc container for the category
category = "canned dog food"
category_document = nlp(____)
# Print similarity score of a given Span and category_document
document_span = document[0:3]
print(f"Semantic similarity with", document_span.text, ":", round(document_span.____(____), 3))