Methoden wiederholen #2
In dieser Übung wiederholst du vier weitere Methoden.
e: Modellierungstechniken, einschließlich LDA, mit denen Text anhand ähnlich verwendeter Wörter in Gruppen oder Typen geclustert wird.f: Eine Methode, um Text zu durchsuchen und Wörter zu markieren, die Personen, Orte oder Organisationen kennzeichnen.g: Methode, um in Text nach bestimmten Mustern zu suchen.h: Darstellung von Wörtern in einem großen Vektorraum, in dem ähnliche Wörter im Vektorraum nahe beieinanderliegen.
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit R
Anleitung zur Übung
- Ordne anhand der 4 Beschreibungen oben das jeweilige Modell oder die Methode dem entsprechenden Buchstaben zu.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Named Entity Recognition
NER <- ___
# Topic Modeling
TM <- ___
# Word Embeddings
WE <- ___
# Regular Expressions
REGEX <- ___