Methoden herhalen #2
In deze oefening herhaal je vier extra methoden.
e: Modelleertechnieken, waaronder LDA, waarmee je tekst clustert in groepen of typen op basis van vergelijkbaar woordgebruik.f: Een methode om tekst te doorzoeken en woorden te taggen die personen, locaties of organisaties aanduiden.g: Methode om in tekst naar specifieke patronen te zoeken.h: Woorden representeren met een hoge-dimensie vectorruimte waarin vergelijkbare woorden dicht bij elkaar liggen.
Deze oefening maakt deel uit van de cursus
Introductie tot Natural Language Processing in R
Oefeninstructies
- Gebruik de 4 bovenstaande beschrijvingen en koppel elk model of elke methode aan de bijbehorende letter.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Named Entity Recognition
NER <- ___
# Topic Modeling
TM <- ___
# Word Embeddings
WE <- ___
# Regular Expressions
REGEX <- ___