Impatto delle parole, analisi di frequenza
Uno dei modi più semplici per esplorare i dati è con un’analisi di frequenza. Anche se non è complessa, nell’analisi del sentiment questa tecnica può rivelarsi sorprendentemente illuminante. In particolare, costruirai un barplot. In questo esercizio lavori di nuovo con moby e bing per creare la tua visualizzazione.
Per ordinare le barre dal valore più basso al più alto, userai un trucco con i fattori. reorder() ti permette di cambiare l’ordine dei livelli di un fattore in base a un’altra variabile di punteggio. In questo caso, riordinerai la variabile fattoriale term in base alla variabile di punteggio polarity.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
moby_tidy_sentiment <- moby %>%
# Inner join to bing lexicon by term = word
inner_join(bing, by = c("term" = "word")) %>%
# Count by term and sentiment, weighted by count
count(___, ___, wt = ___) %>%
# Pivot sentiment, using n as values
pivot_wider(names_from = ___, values_from = ___, values_fill = ___) %>%
# Mutate to add a polarity column
mutate(polarity = ___ - ___)
# Review
moby_tidy_sentiment