Grafico di densità kernel
Ora che hai imparato cos’è un grafico di densità kernel, puoi crearne uno! Ricorda: è come un istogramma “smussato”, ma non è influenzato dalla larghezza delle classi (binwidth). Questo esercizio ti aiuterà a costruire un grafico di densità kernel a partire dai valori di sentiment.
In questo esercizio traccerai 2 densità kernel: una per Agamennone e un’altra per Il mago di Oz. Per entrambi eseguirai un inner_join() con il lessico "afinn". Ricorda che il lessico "afinn" assegna ai termini punteggi da -5 a 5. Una volta in formato tidy, entrambi i libri conserveranno le parole e i relativi punteggi del lessico.
Dopodiché dovrai concatenare le righe dei risultati in un data frame più grande usando bind_rows() e creare un grafico con ggplot2.
Dal grafico potrai capire quale libro usa più linguaggio positivo rispetto a quello negativo. C’è chiaramente sovrapposizione, perché a Dorothy capitano cose negative, ma potresti dedurre che la densità kernel mostra una probabilità maggiore di linguaggio positivo ne Il mago di Oz rispetto ad Agamennone.
Abbiamo caricato ag e oz come versioni tidy rispettivamente di Agamennone e Il mago di Oz e creato afinn come sottoinsieme del lessico "afinn" di tidytext.
Questo esercizio fa parte del corso
Sentiment Analysis in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
ag_afinn <- ag %>%
# Inner join to afinn lexicon
___(___, by = c("term" = "word"))
oz_afinn <- oz %>%
# Inner join to afinn lexicon
___
# Combine
all_df <- ___(agamemnon = ___, oz = ___, .id = "___")