LoslegenKostenlos starten

Sentiment und Emotion

Im sentiments-Datensatz enthält das Lexikon nrc ein Wörterbuch mit Wörtern und der jeweils zugeordneten Emotion. In diesem Datensatz findest du Emotionen wie Freude (joy), Vertrauen (trust), Erwartung (anticipation) und weitere.

Im Datensatz zum russischen Tweet-Bot, den du untersuchst, hast du dir Tweets von einem links- und einem rechtsgerichteten Tweet-Bot angesehen. Untersuche den Inhalt der Tweets des linksgerichteten (demokratischen) Tweet-Bots mit Hilfe des nrc-Lexikons. Die linken Tweets, left, wurden in Wörter tokenisiert und Stoppwörter wurden entfernt.

Diese Übung ist Teil des Kurses

<Kurs>Einführung in Natural Language Processing mit R</Kurs>
Kurs ansehen

Übungsanweisungen

  • Erstelle ein Tibble nur mit den Wörtern zur Emotion „anticipation“ aus dem nrc-Lexikon.
  • Erstelle ein Tibble nur mit den Wörtern zur Emotion „joy“ aus dem nrc-Lexikon.
  • Gib die häufigsten anticipation-Wörter aus left_tokens aus.
  • Gib die häufigsten joy-Wörter aus left_tokens aus.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

left_tokens <- left %>%
  unnest_tokens(output = "word", token = "words", input = content) %>%
  anti_join(stop_words)
# Dictionaries 
anticipation <- ___("nrc") %>% 
  ___(sentiment == "anticipation")
joy <- ___("nrc") %>% 
  ___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
  ___(anticipation, by = "word") %>%
  ___(word, sort = TRUE)
left_tokens %>%
  ___(joy, by = "word") %>%
  ___(word, sort = TRUE)
Code bearbeiten und ausführen