Wortsinndisambiguierung mit spaCy
WSD ist ein klassisches Problem: Es geht darum, zu entscheiden, in welcher Bedeutung ein Wort in einem Satz verwendet wird. Die Bestimmung der Wortbedeutung ist z. B. in Suchmaschinen, der maschinellen Übersetzung und in Frage-Antwort-Systemen entscheidend. In dieser Übung übst du, POS-Tagging für die Wortsinndisambiguierung zu nutzen.
Es gibt zwei Sätze mit dem Wort jam, jeweils mit unterschiedlicher Bedeutung. Deine Aufgabe ist es, die POS-Tags zu identifizieren, die dir helfen, die passende Bedeutung des Wortes im jeweiligen Satz zu bestimmen.
Die beiden Sätze stehen in der Liste texts bereit. Das Modell en_core_web_sm ist bereits geladen und als nlp verfügbar.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
texts = ["This device is used to jam the signal.",
"I am stuck in a traffic jam"]
# Create a list of Doc containers in the texts list
documents = [____ for t in texts]
# Print a token's text and POS tag if the word jam is in the token's text
for i, doc in enumerate(documents):
print(f"Sentence {i+1}: ", [(____, ____) for token in doc if "jam" in token.text], "\n")