Woordimpact, frequentie-analyse

Een van de eenvoudigste manieren om data te verkennen is met een frequentie-analyse. Hoewel niet moeilijk, kan deze simpele methode binnen sentimentanalyse verrassend verhelderend zijn. In deze oefening bouw je een staafdiagram. Je werkt opnieuw met moby en bing om je visualisatie te maken.

Om de staven van laag naar hoog te ordenen, gebruik je een trucje met factoren. reorder() laat je de volgorde van factorlevels veranderen op basis van een andere variabele met scores. In dit geval herordenen we de factorvariabele term op basis van de scorevariabele polarity.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

moby_tidy_sentiment <- moby %>% 
  # Inner join to bing lexicon by term = word
  inner_join(bing, by = c("term" = "word")) %>% 
  # Count by term and sentiment, weighted by count
  count(___, ___, wt = ___) %>%
  # Pivot sentiment, using n as values
  pivot_wider(names_from = ___, values_from = ___, values_fill = ___) %>%
  # Mutate to add a polarity column
  mutate(polarity = ___ - ___)

# Review
moby_tidy_sentiment

Code bewerken en uitvoeren