Aan de slagGa gratis aan de slag

POS-tagging met spaCy

In deze oefening ga je oefenen met POS-tagging. POS-tagging is nuttig in NLP, omdat het algoritmes helpt de grammaticale structuur van een zin te begrijpen en woorden met meerdere betekenissen, zoals watch en play, te onderscheiden.

Voor deze oefening is en_core_web_sm al voor je geladen als nlp. Drie opmerkingen uit de Airline Travel Information System (ATIS)-gegevensset zijn voor je beschikbaar gesteld in een lijst met de naam texts.

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

Cursus bekijken

Oefeninstructies

  • Stel documents samen: een lijst met alle doc-containers voor elke tekst in de lijst texts met behulp van list comprehension.
  • Print voor elke doc-container de tekst van elk token en de bijbehorende POS-tag door te itereren over documents en de tokens van elke doc-container met een geneste for-loop.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]

# Print token texts and POS tags for each Doc container
for doc in documents:
    for ____ in doc:
        print("Text: ", ____, "| POS tag: ", ____)
    print("\n")
Code bewerken en uitvoeren