POS-Tagging mit spaCy
In dieser Übung trainierst du POS-Tagging. POS-Tagging ist in der NLP-Praxis nützlich, weil Algorithmen damit die grammatische Struktur eines Satzes verstehen und Wörter mit mehreren Bedeutungen wie watch und play eindeutig zuordnen können.
Für diese Übung wurde en_core_web_sm bereits als nlp geladen. Drei Kommentare aus dem Airline Travel Information System (ATIS)-Datensatz wurden dir in einer Liste namens texts bereitgestellt.
Diese Übung ist Teil des Kurses
Natural Language Processing mit spaCy
Anleitung zur Übung
- Erstelle
documents, eine Liste allerdoc-Container für jeden Text in der Listetextsmithilfe von List Comprehension. - Gib für jeden
doc-Container den Text jedes Tokens zusammen mit seinem zugehörigen POS-Tag aus, indem du mit einer verschachtelten For-Schleife überdocumentsund die Tokens jedesdoc-Containers iterierst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]
# Print token texts and POS tags for each Doc container
for doc in documents:
for ____ in doc:
print("Text: ", ____, "| POS tag: ", ____)
print("\n")