Sentiment ed emozioni
All'interno del dataset sentiments, il lessico nrc contiene un dizionario di parole e un'emozione associata a ciascuna parola. In questo dataset trovi emozioni come joy, trust, anticipation e altre.
Nel dataset dei tweet bot russi che hai esplorato, hai analizzato i tweet inviati sia da un bot con orientamento di sinistra sia da uno di destra. Esplora il contenuto dei tweet inviati dal bot di sinistra (democratico) usando il lessico nrc. I tweet di sinistra, left, sono stati tokenizzati in parole, con le stop word rimosse.
Questo esercizio fa parte del corso
Introduzione all'Elaborazione del Linguaggio Naturale in R
Istruzioni dell'esercizio
- Crea una tibble con solo le parole di tipo anticipation dal lessico
nrc. - Crea una tibble con solo le parole di tipo joy dal lessico
nrc. - Stampa le parole principali di
anticipationtrovate inleft_tokens. - Stampa le parole principali di
joytrovate inleft_tokens.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
left_tokens <- left %>%
unnest_tokens(output = "word", token = "words", input = content) %>%
anti_join(stop_words)
# Dictionaries
anticipation <- ___("nrc") %>%
___(sentiment == "anticipation")
joy <- ___("nrc") %>%
___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
___(anticipation, by = "word") %>%
___(word, sort = TRUE)
left_tokens %>%
___(joy, by = "word") %>%
___(word, sort = TRUE)