Themen Dokumenten zuweisen

LDA-Modelle sind nur dann nützlich, wenn du die Ergebnisse interpretieren und verwenden kannst. du hast die Ergebnisse eines LDA-Modells sentence_lda für einen Satz-Datensatz pig_sentences erhalten. Um die Ergebnisse einer LDA-Analyse vollständig zu verstehen, musst du sowohl die beta-Matrix (Top-Wörter je Thema) als auch die gamma-Matrix (Top-Themen je Dokument) untersuchen.

Nutze dein Wissen über diese beiden Matrizen, extrahiere die Ergebnisse für ein bestimmtes Thema und prüfe, ob die Ausgabe zu den Erwartungen passt.

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit R

Kurs anzeigen

Anleitung zur Übung

Erstelle je ein Tibble für die Matrizen beta und gamma.
Untersuche Thema 5, indem du dir die Top-Wörter für Thema 5 ansiehst und die Ergebnisse nach absteigenden beta-Werten sortierst.
Untersuche Thema 5, indem du prüfst, welche Sätze am stärksten zu Thema 5 passen, und sortiere die Ergebnisse nach absteigenden gamma-Werten.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Extract the beta and gamma matrices
sentence_betas <- tidy(sentence_lda, ___ = "___")
sentence_gammas <- tidy(sentence_lda, ___ = "___")

# Explore Topic 5 Betas
___ %>%
  ___(topic == ___) %>%
  arrange(-___)

# Explore Topic 5 Gammas
___ %>%
  ___(topic == ___) %>%
  arrange(-___)

Code bearbeiten und ausführen

Einführung in Natural Language Processing mit R

Mittlere SchwierigkeitSchwierigkeitsgrad

4.8+

33 reviews

In Kapitel 4 behandeln wir zwei feste Größen des Natural Language Processing: Sentiment-Analyse und Word Embeddings. Diese beiden Analysetechniken gehören für alle, die die Grundlagen der Textanalyse lernen, einfach dazu. Außerdem erfährst du kurz etwas über BERT, Part-of-Speech-Tagging und Named Entity Recognition. In diesem Kurs wurden fast 15 verschiedene Analysetechniken abgedeckt, daher endet Kapitel 4 mit einer Zusammenfassung all der großartigen Techniken, die du in diesem Kurs kennenlernen wirst.

Exercise 1: Sentimentanalyse Exercise 2: tidytext-Lexika Exercise 3: Sentiment-Scores Exercise 4: Sentiment und Emotion Exercise 5: Wort-Embeddings Exercise 6: h2o-Übung Exercise 7: word2vec Exercise 8: Zusätzliche NLP-Analysen Exercise 9: Methoden wiederholen #1 Exercise 10: Methoden wiederholen #2 Exercise 11: Fazit