IniziaInizia gratis

Sentiment ed emozioni

All'interno del dataset sentiments, il lessico nrc contiene un dizionario di parole e un'emozione associata a ciascuna parola. In questo dataset trovi emozioni come joy, trust, anticipation e altre.

Nel dataset dei tweet bot russi che hai esplorato, hai analizzato i tweet inviati sia da un bot con orientamento di sinistra sia da uno di destra. Esplora il contenuto dei tweet inviati dal bot di sinistra (democratico) usando il lessico nrc. I tweet di sinistra, left, sono stati tokenizzati in parole, con le stop word rimosse.

Questo esercizio fa parte del corso

Introduzione all'Elaborazione del Linguaggio Naturale in R

Visualizza il corso

Istruzioni dell'esercizio

  • Crea una tibble con solo le parole di tipo anticipation dal lessico nrc.
  • Crea una tibble con solo le parole di tipo joy dal lessico nrc.
  • Stampa le parole principali di anticipation trovate in left_tokens.
  • Stampa le parole principali di joy trovate in left_tokens.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

left_tokens <- left %>%
  unnest_tokens(output = "word", token = "words", input = content) %>%
  anti_join(stop_words)
# Dictionaries 
anticipation <- ___("nrc") %>% 
  ___(sentiment == "anticipation")
joy <- ___("nrc") %>% 
  ___(sentiment == "joy")
# Print top words for Anticipation and Joy
left_tokens %>%
  ___(anticipation, by = "word") %>%
  ___(word, sort = TRUE)
left_tokens %>%
  ___(joy, by = "word") %>%
  ___(word, sort = TRUE)
Modifica ed esegui il codice