In dit hoofdstuk maak je kennis met de basis van tekstverwerking met spaCy. Je leert over de datastructuren, hoe je met statistische modellen werkt en hoe je die gebruikt om linguïstische kenmerken in je tekst te voorspellen.

Introductie tot spaCy

Aan de slag

Documents, spans en tokens

Lexicale attributen

Statistische modellen

Modelpakketten

Modellen laden

Taalkundige annotaties voorspellen

Naamgegeven entiteiten in context voorspellen

Regelgebaseerd matchen

De Matcher gebruiken

Match-patronen schrijven

Woorden, zinnen, namen en concepten vinden

In dit hoofdstuk gebruik je je nieuwe vaardigheden om specifieke informatie uit grote hoeveelheden tekst te halen. Je leert hoe je het maximale haalt uit spaCy's datastructuren en hoe je statistische en regelgebaseerde benaderingen effectief combineert voor tekstanalyse.

Datastructuren (1)

Strings naar hashes

Vocab, hashes en lexemen

Datastructuren (2)

Een Doc maken

Docs, spans en entiteiten vanaf nul

Best practices voor datastructuren

Woordvectoren en gelijkenis

Woordvectoren inspecteren

Overeenkomsten vergelijken

Modellen en regels combineren

Patronen debuggen (1)

Patronen debuggen (2)

Efficiënt zinsdeelmatchen

Landen en relaties extraheren

Analyse van grootschalige data met spaCy

Dit hoofdstuk laat je alles zien wat je moet weten over de verwerkingspipeline van spaCy. Je leert wat er onder de motorkap gebeurt wanneer je een tekst verwerkt, hoe je je eigen componenten schrijft en toevoegt aan de pipeline, en hoe je aangepaste attributen gebruikt om je eigen metadata toe te voegen aan documenten, spans en tokens.

Verwerkingspipelines

Wat gebeurt er als je nlp aanroept?

De pipeline inspecteren

Aangepaste pipeline-componenten

Use-cases voor aangepaste componenten

Eenvoudige componenten

Complexe componenten

Extensie-attributen

Extensie-attributen instellen (1)

Extensie-attributen instellen (2)

Entiteiten en extensies

Componenten met extensies

Schaalbaarheid en performance

Verwerkingsstreams

Data verwerken met context

Selectief verwerken

In dit hoofdstuk leer je hoe je de statistische modellen van spaCy bijwerkt en afstemt op jouw usecase – bijvoorbeeld om een nieuw entiteitstype te voorspellen in online reacties. Je schrijft je eigen trainingslus vanaf nul en begrijpt de basis van hoe training werkt, samen met tips en trucs die je aangepaste NLP-projecten succesvoller maken.

Modellen trainen en updaten

Doel van training

Trainingsdata maken (1)

Trainingsdata maken (2)

De training-loop

De pipeline opzetten

Een trainingslus bouwen

Het model verkennen

Best practices voor trainen

Goede data vs. slechte data

Meerdere labels trainen

Afronding

Een neuraal netwerkmodel trainen

Als je met veel tekst werkt, wil je er uiteindelijk meer over weten. Waar gaat het bijvoorbeeld over? Wat betekenen woorden in context? Wie doet wat bij wie? Welke bedrijven en producten worden genoemd? Welke teksten lijken op elkaar? In deze cursus leer je hoe je spaCy gebruikt, een snelgroeiende industriestandaardbibliotheek voor NLP in Python, om geavanceerde systemen voor natuurlijke taalverwerking te bouwen, met zowel regelgebaseerde als Machine Learning-aanpakken.

Introduction to Natural Language Processing in Python

Leer hoe je spaCy gebruikt voor geavanceerde taalbegripssystemen met regels en machine learning.

Afronding

Create Your Free Account