Sentiment und Emotion
Im sentiments-Datensatz enthält das Lexikon nrc ein Wörterbuch mit Wörtern und der jeweils zugeordneten Emotion. In diesem Datensatz findest du Emotionen wie Freude (joy), Vertrauen (trust), Erwartung (anticipation) und weitere.
Im Datensatz zum russischen Tweet-Bot, den du untersuchst, hast du dir Tweets von einem links- und einem rechtsgerichteten Tweet-Bot angesehen. Untersuche den Inhalt der Tweets des linksgerichteten (demokratischen) Tweet-Bots mit Hilfe des nrc-Lexikons. Die linken Tweets, left, wurden in Wörter tokenisiert und Stoppwörter wurden entfernt.
Diese Übung ist Teil des Kurses
Einführung in Natural Language Processing mit R
Anleitung zur Übung
- Erstelle ein Tibble nur mit den Wörtern zur Emotion „anticipation“ aus dem
nrc-Lexikon. - Erstelle ein Tibble nur mit den Wörtern zur Emotion „joy“ aus dem
nrc-Lexikon. - Gib die häufigsten
anticipation-Wörter ausleft_tokensaus. - Gib die häufigsten
joy-Wörter ausleft_tokensaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
left_tokens <- left %>%
unnest_tokens(output = "word", token = "words", input = content) %>%
anti_join(stop_words)
# Dictionaries
anticipation <- ___("nrc") %>%
___(sentiment == "anticipation")
joy <- ___("nrc") %>%
___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
___(anticipation, by = "word") %>%
___(word, sort = TRUE)
left_tokens %>%
___(joy, by = "word") %>%
___(word, sort = TRUE)