Een spaCy-pijplijn uitvoeren

Je hebt al een spaCy NLP-pijplijn uitgevoerd op één stuk tekst en ook tokens geëxtraheerd uit een lijst met Doc-containers. In deze oefening oefen je de eerste stappen van het draaien van een spaCy-pijplijn op texts, een lijst met tekststrings.

Je gebruikt hiervoor het en_core_web_sm-model. Het spaCy-pakket is al voor je geïmporteerd.

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

Oefeninstructies

Laad het en_core_web_sm-model als nlp.
Voer een nlp()-model uit op elk item van texts en voeg elke overeenkomstige Doc-container toe aan een documents-lijst.
Print de token-teksten voor elke Doc-container in de documents-lijst.

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Load en_core_web_sm model as nlp
nlp = spacy.____(____)

# Run an nlp model on each item of texts and append the Doc container to documents
documents = []
for text in ____:
  documents.append(____)
  
# Print the token texts for each Doc container
for doc in documents:
  print([____ for ____ in ____])

Code bewerken en uitvoeren

Deze oefening maakt deel uit van de cursus

Natural Language Processing met spaCy

SkillTag.level.intermediateSkillTag.label

4.8+

Begin gratis met de cursus

In dit hoofdstuk maak je kennis met NLP, enkele toepassingsgebieden zoals named entity recognition en AI-aangedreven chatbots. Je leert de krachtige spaCy-bibliotheek gebruiken voor diverse Natural Language Processing-taken zoals tokenization, zinssegmentatie, POS-tagging en named entity recognition.

Exercise 1: Basis van Natural Language Processing (NLP)Exercise 2: Doc-container in spaCy Exercise 3: Gebruiksscenario van NER Exercise 4: Tokenization met spaCy Exercise 5: spaCy-basics Exercise 6: Een spaCy-pijplijn uitvoeren

Huidige oefening

Exercise 7: Lemmatization met spaCy Exercise 8: Zinssegmentatie met spaCy Exercise 9: Taalkenmerken in spaCy Exercise 10: POS-tagging met spaCy Exercise 11: NER met spaCy Exercise 12: Tekstverwerking met spaCy

Leer over taalkundige kenmerken, woordvectoren, semantische gelijkenis, analogieën en bewerkingen met woordvectoren. In dit hoofdstuk ontdek je hoe je met spaCy woordvectoren extraheert, teksten categoriseert die relevant zijn voor een bepaald onderwerp en semantisch vergelijkbare termen vindt voor opgegeven woorden uit een corpus of uit de woordenschat van een spaCy-model.

Exercise 1: Linguïstische kenmerken Exercise 2: Linguïstische annotaties in spaCy Exercise 3: Woordbetekenis-ontleding met spaCy Exercise 4: Dependency parsing met spaCy Exercise 5: Introductie tot woordvectoren Exercise 6: spaCy-woordenschat Exercise 7: Woordvectoren in de spaCy-woordenschat Exercise 8: Woordvectoren en spaCy Exercise 9: Analogieën en vectorbewerkingen Exercise 10: Projectie van woordvectoren Exercise 11: Soortgelijke woorden in een vocabulaire Exercise 12: Semantische overeenkomsten meten met spaCy Exercise 13: Doc-overeenkomst met spaCy Exercise 14: Span-overeenkomst met spaCy Exercise 15: Semantische gelijkenis voor het categoriseren van tekst

Maak kennis met spaCy-pipelinecomponenten, hoe je een pipelinecomponent toevoegt en analyseer de NLP-pipeline. Je leert ook meerdere aanpakken voor regelgebaseerde informatie-extractie met de EntityRuler-, Matcher- en PhraseMatcher-klassen in spaCy en het Python-pakket RegEx.

Exercise 1: spaCy-pijplijnen Exercise 2: Pijplijnen toevoegen in spaCy Exercise 3: Pipelines in spaCy analyseren Exercise 4: spaCy EntityRuler Exercise 5: EntityRuler met een lege spaCy‑model Exercise 6: EntityRuler voor NER Exercise 7: EntityRuler met meerdere patronen in spaCy Exercise 8: RegEx met spaCy Exercise 9: RegEx in Python Exercise 10: RegEx met EntityRuler in spaCy Exercise 11: spaCy Matcher en PhraseMatcher Exercise 12: Eén term matchen in spaCy Exercise 13: PhraseMatcher in spaCy Exercise 14: Matchen met uitgebreide syntax in spaCy

Verken meerdere praktijkgevallen waarin spaCy-modellen kunnen falen en leer hoe je ze verder traint om de modelprestaties te verbeteren. Je maakt kennis met de trainingsstappen van spaCy en begrijpt hoe je een bestaand spaCy-model of een model vanaf nul traint en het model tijdens inference evalueert.

Exercise 1: spaCy-modellen aanpassen Exercise 2: spaCy-modellen trainen Exercise 3: Modelprestaties op je eigen data Exercise 4: spaCy-trainingsdataformaat Exercise 5: Trainingsstappen Exercise 6: Annoteren en trainingsdata voorbereiden Exercise 7: Compatibele trainingsdata Exercise 8: Trainen met spaCy Exercise 9: Stappen ter voorbereiding van training Exercise 10: Train een bestaand NER-model Exercise 11: Een spaCy-model vanaf nul trainen Exercise 12: Afronding