POS-tagging met spaCy

In deze oefening ga je oefenen met POS-tagging. POS-tagging is nuttig in NLP, omdat het algoritmes helpt de grammaticale structuur van een zin te begrijpen en woorden met meerdere betekenissen, zoals watch en play, te onderscheiden.

Voor deze oefening is en_core_web_sm al voor je geladen als nlp. Drie opmerkingen uit de Airline Travel Information System (ATIS)-gegevensset zijn voor je beschikbaar gesteld in een lijst met de naam texts.

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

Oefeninstructies

Stel documents samen: een lijst met alle doc-containers voor elke tekst in de lijst texts met behulp van list comprehension.
Print voor elke doc-container de tekst van elk token en de bijbehorende POS-tag door te itereren over documents en de tokens van elke doc-container met een geneste for-loop.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Compile a list of all Doc containers of texts
documents = [____(text) for text in texts]

# Print token texts and POS tags for each Doc container
for doc in documents:
    for ____ in doc:
        print("Text: ", ____, "| POS tag: ", ____)
    print("\n")

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

In dit hoofdstuk maak je kennis met NLP, enkele toepassingsgebieden zoals named entity recognition en AI-aangedreven chatbots. Je leert de krachtige spaCy-bibliotheek gebruiken voor diverse Natural Language Processing-taken zoals tokenization, zinssegmentatie, POS-tagging en named entity recognition.

Exercise 1: Basis van Natural Language Processing (NLP)Exercise 2: Doc-container in spaCy Exercise 3: Gebruiksscenario van NER Exercise 4: Tokenization met spaCy Exercise 5: spaCy-basics Exercise 6: Een spaCy-pijplijn uitvoeren Exercise 7: Lemmatization met spaCy Exercise 8: Zinssegmentatie met spaCy Exercise 9: Taalkenmerken in spaCy Exercise 10: POS-tagging met spaCy

Huidige oefening

Exercise 11: NER met spaCy Exercise 12: Tekstverwerking met spaCy

Leer over taalkundige kenmerken, woordvectoren, semantische gelijkenis, analogieën en bewerkingen met woordvectoren. In dit hoofdstuk ontdek je hoe je met spaCy woordvectoren extraheert, teksten categoriseert die relevant zijn voor een bepaald onderwerp en semantisch vergelijkbare termen vindt voor opgegeven woorden uit een corpus of uit de woordenschat van een spaCy-model.

Exercise 1: Linguïstische kenmerken Exercise 2: Linguïstische annotaties in spaCy Exercise 3: Woordbetekenis-ontleding met spaCy Exercise 4: Dependency parsing met spaCy Exercise 5: Introductie tot woordvectoren Exercise 6: spaCy-woordenschat Exercise 7: Woordvectoren in de spaCy-woordenschat Exercise 8: Woordvectoren en spaCy Exercise 9: Analogieën en vectorbewerkingen Exercise 10: Projectie van woordvectoren Exercise 11: Soortgelijke woorden in een vocabulaire Exercise 12: Semantische overeenkomsten meten met spaCy Exercise 13: Doc-overeenkomst met spaCy Exercise 14: Span-overeenkomst met spaCy Exercise 15: Semantische gelijkenis voor het categoriseren van tekst

Maak kennis met spaCy-pipelinecomponenten, hoe je een pipelinecomponent toevoegt en analyseer de NLP-pipeline. Je leert ook meerdere aanpakken voor regelgebaseerde informatie-extractie met de EntityRuler-, Matcher- en PhraseMatcher-klassen in spaCy en het Python-pakket RegEx.

Exercise 1: spaCy-pijplijnen Exercise 2: Pijplijnen toevoegen in spaCy Exercise 3: Pipelines in spaCy analyseren Exercise 4: spaCy EntityRuler Exercise 5: EntityRuler met een lege spaCy‑model Exercise 6: EntityRuler voor NER Exercise 7: EntityRuler met meerdere patronen in spaCy Exercise 8: RegEx met spaCy Exercise 9: RegEx in Python Exercise 10: RegEx met EntityRuler in spaCy Exercise 11: spaCy Matcher en PhraseMatcher Exercise 12: Eén term matchen in spaCy Exercise 13: PhraseMatcher in spaCy Exercise 14: Matchen met uitgebreide syntax in spaCy

Verken meerdere praktijkgevallen waarin spaCy-modellen kunnen falen en leer hoe je ze verder traint om de modelprestaties te verbeteren. Je maakt kennis met de trainingsstappen van spaCy en begrijpt hoe je een bestaand spaCy-model of een model vanaf nul traint en het model tijdens inference evalueert.

Exercise 1: spaCy-modellen aanpassen Exercise 2: spaCy-modellen trainen Exercise 3: Modelprestaties op je eigen data Exercise 4: spaCy-trainingsdataformaat Exercise 5: Trainingsstappen Exercise 6: Annoteren en trainingsdata voorbereiden Exercise 7: Compatibele trainingsdata Exercise 8: Trainen met spaCy Exercise 9: Stappen ter voorbereiding van training Exercise 10: Train een bestaand NER-model Exercise 11: Een spaCy-model vanaf nul trainen Exercise 12: Afronding