Aan de slagGa gratis aan de slag

Kernel density-plot

Nu je hebt geleerd wat een kernel density-plot is, kun je er zelf een maken! Onthoud: het lijkt op een gladgestreken histogram, maar is niet afhankelijk van de binbreedte. In deze oefening bouw je een kernel density-plot op basis van sentimentwaarden.

In deze oefening plot je 2 kernel-dichtheden: één voor Agamemnon en één voor The Wizard of Oz. Voor beide voer je een inner_join() uit met het "afinn"-lexicon. Weet je nog: het "afinn"-lexicon kent scores toe van -5 tot 5. In een tidy-formaat behouden beide boeken de woorden met de bijbehorende scores uit het lexicon.

Daarna voeg je de resultaten rij-gewijs samen tot één groter data frame met bind_rows() en maak je een plot met ggplot2.

Aan de visualisatie kun je zien welk boek meer positieve of juist negatieve taal gebruikt. Er is duidelijk overlap, want er gebeuren ook negatieve dingen met Dorothy, maar je kunt afleiden dat de kernel-dichtheid een grotere kans op positieve taal laat zien in The Wizard of Oz vergeleken met Agamemnon.

We hebben ag en oz al geladen als tidy-versies van respectievelijk Agamemnon en The Wizard of Oz, en afinn aangemaakt als subset van het tidytext "afinn"-lexicon.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

ag_afinn <- ag %>% 
  # Inner join to afinn lexicon
  ___(___, by = c("term" = "word"))

oz_afinn <- oz %>% 
  # Inner join to afinn lexicon
  ___ 

# Combine
all_df <- ___(agamemnon = ___, oz = ___, .id = "___")
Code bewerken en uitvoeren