or
Deze oefening maakt deel uit van de cursus
In dit hoofdstuk maak je kennis met de basis van tekstverwerking met spaCy. Je leert over de datastructuren, hoe je met statistische modellen werkt en hoe je die gebruikt om linguïstische kenmerken in je tekst te voorspellen.
In dit hoofdstuk gebruik je je nieuwe vaardigheden om specifieke informatie uit grote hoeveelheden tekst te halen. Je leert hoe je het maximale haalt uit spaCy's datastructuren en hoe je statistische en regelgebaseerde benaderingen effectief combineert voor tekstanalyse.
Dit hoofdstuk laat je alles zien wat je moet weten over de verwerkingspipeline van spaCy. Je leert wat er onder de motorkap gebeurt wanneer je een tekst verwerkt, hoe je je eigen componenten schrijft en toevoegt aan de pipeline, en hoe je aangepaste attributen gebruikt om je eigen metadata toe te voegen aan documenten, spans en tokens.
In dit hoofdstuk leer je hoe je de statistische modellen van spaCy bijwerkt en afstemt op jouw usecase – bijvoorbeeld om een nieuw entiteitstype te voorspellen in online reacties. Je schrijft je eigen trainingslus vanaf nul en begrijpt de basis van hoe training werkt, samen met tips en trucs die je aangepaste NLP-projecten succesvoller maken.
Huidige oefening