POS-tagging met spaCy
In deze oefening ga je oefenen met POS-tagging. POS-tagging is nuttig in NLP, omdat het algoritmes helpt de grammaticale structuur van een zin te begrijpen en woorden met meerdere betekenissen, zoals watch en play, te onderscheiden.
Voor deze oefening is en_core_web_sm al voor je geladen als nlp. Drie opmerkingen uit de Airline Travel Information System (ATIS)-gegevensset zijn voor je beschikbaar gesteld in een lijst met de naam texts.
Deze oefening maakt deel uit van de cursus
Natural Language Processing met spaCy
Oefeninstructies
- Stel
documentssamen: een lijst met alledoc-containers voor elke tekst in de lijsttextsmet behulp van list comprehension. - Print voor elke
doc-container de tekst van elk token en de bijbehorende POS-tag door te itereren overdocumentsen de tokens van elkedoc-container met een geneste for-loop.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]
# Print token texts and POS tags for each Doc container
for doc in documents:
for ____ in doc:
print("Text: ", ____, "| POS tag: ", ____)
print("\n")