LoslegenKostenlos starten

Wortsinndisambiguierung mit spaCy

WSD ist ein klassisches Problem: Es geht darum, zu entscheiden, in welcher Bedeutung ein Wort in einem Satz verwendet wird. Die Bestimmung der Wortbedeutung ist z. B. in Suchmaschinen, der maschinellen Übersetzung und in Frage-Antwort-Systemen entscheidend. In dieser Übung übst du, POS-Tagging für die Wortsinndisambiguierung zu nutzen.

Es gibt zwei Sätze mit dem Wort jam, jeweils mit unterschiedlicher Bedeutung. Deine Aufgabe ist es, die POS-Tags zu identifizieren, die dir helfen, die passende Bedeutung des Wortes im jeweiligen Satz zu bestimmen.

Die beiden Sätze stehen in der Liste texts bereit. Das Modell en_core_web_sm ist bereits geladen und als nlp verfügbar.

Diese Übung ist Teil des Kurses

<Kurs>Natural Language Processing mit spaCy</Kurs>
Kurs ansehen

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

texts = ["This device is used to jam the signal.",
         "I am stuck in a traffic jam"]

# Create a list of Doc containers in the texts list
documents = [____ for t in texts]

# Print a token's text and POS tag if the word jam is in the token's text
for i, doc in enumerate(documents):
    print(f"Sentence {i+1}: ", [(____, ____) for token in doc if "jam" in token.text], "\n")
Code bearbeiten und ausführen