Woordimpact, frequentie-analyse
Een van de eenvoudigste manieren om data te verkennen is met een frequentie-analyse. Hoewel niet moeilijk, kan deze simpele methode binnen sentimentanalyse verrassend verhelderend zijn. In deze oefening bouw je een staafdiagram. Je werkt opnieuw met moby en bing om je visualisatie te maken.
Om de staven van laag naar hoog te ordenen, gebruik je een trucje met factoren. reorder() laat je de volgorde van factorlevels veranderen op basis van een andere variabele met scores. In dit geval herordenen we de factorvariabele term op basis van de scorevariabele polarity.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
moby_tidy_sentiment <- moby %>%
# Inner join to bing lexicon by term = word
inner_join(bing, by = c("term" = "word")) %>%
# Count by term and sentiment, weighted by count
count(___, ___, wt = ___) %>%
# Pivot sentiment, using n as values
pivot_wider(names_from = ___, values_from = ___, values_fill = ___) %>%
# Mutate to add a polarity column
mutate(polarity = ___ - ___)
# Review
moby_tidy_sentiment