LoslegenKostenlos loslegen

Sentiment und Emotion

Im sentiments-Datensatz enthält das Lexikon nrc ein Wörterbuch mit Wörtern und der jeweils zugeordneten Emotion. In diesem Datensatz findest du Emotionen wie Freude (joy), Vertrauen (trust), Erwartung (anticipation) und weitere.

Im Datensatz zum russischen Tweet-Bot, den du untersuchst, hast du dir Tweets von einem links- und einem rechtsgerichteten Tweet-Bot angesehen. Untersuche den Inhalt der Tweets des linksgerichteten (demokratischen) Tweet-Bots mit Hilfe des nrc-Lexikons. Die linken Tweets, left, wurden in Wörter tokenisiert und Stoppwörter wurden entfernt.

Diese Übung ist Teil des Kurses

Einführung in Natural Language Processing mit R

Kurs anzeigen

Anleitung zur Übung

  • Erstelle ein Tibble nur mit den Wörtern zur Emotion „anticipation“ aus dem nrc-Lexikon.
  • Erstelle ein Tibble nur mit den Wörtern zur Emotion „joy“ aus dem nrc-Lexikon.
  • Gib die häufigsten anticipation-Wörter aus left_tokens aus.
  • Gib die häufigsten joy-Wörter aus left_tokens aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

left_tokens <- left %>%
  unnest_tokens(output = "word", token = "words", input = content) %>%
  anti_join(stop_words)
# Dictionaries 
anticipation <- ___("nrc") %>% 
  ___(sentiment == "anticipation")
joy <- ___("nrc") %>% 
  ___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
  ___(anticipation, by = "word") %>%
  ___(word, sort = TRUE)
left_tokens %>%
  ___(joy, by = "word") %>%
  ___(word, sort = TRUE)
Code bearbeiten und ausführen