Grafico di densità kernel

Ora che hai imparato cos’è un grafico di densità kernel, puoi crearne uno! Ricorda: è come un istogramma “smussato”, ma non è influenzato dalla larghezza delle classi (binwidth). Questo esercizio ti aiuterà a costruire un grafico di densità kernel a partire dai valori di sentiment.

In questo esercizio traccerai 2 densità kernel: una per Agamennone e un’altra per Il mago di Oz. Per entrambi eseguirai un inner_join() con il lessico "afinn". Ricorda che il lessico "afinn" assegna ai termini punteggi da -5 a 5. Una volta in formato tidy, entrambi i libri conserveranno le parole e i relativi punteggi del lessico.

Dopodiché dovrai concatenare le righe dei risultati in un data frame più grande usando bind_rows() e creare un grafico con ggplot2.

Dal grafico potrai capire quale libro usa più linguaggio positivo rispetto a quello negativo. C’è chiaramente sovrapposizione, perché a Dorothy capitano cose negative, ma potresti dedurre che la densità kernel mostra una probabilità maggiore di linguaggio positivo ne Il mago di Oz rispetto ad Agamennone.

Abbiamo caricato ag e oz come versioni tidy rispettivamente di Agamennone e Il mago di Oz e creato afinn come sottoinsieme del lessico "afinn" di tidytext.

Questo esercizio fa parte del corso

Sentiment Analysis in R

Visualizza corso

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

ag_afinn <- ag %>% 
  # Inner join to afinn lexicon
  ___(___, by = c("term" = "word"))

oz_afinn <- oz %>% 
  # Inner join to afinn lexicon
  ___ 

# Combine
all_df <- ___(agamemnon = ___, oz = ___, .id = "___")

Modifica ed esegui il codice