Sentimentlexicons ophalen
Tot nu toe heb je één lexicon gebruikt. Nu stappen we over op drie lexicons, die elk sentiment op een andere manier meten.
Het pakket tidytext bevat een functie genaamd get_sentiments waarmee je, samen met het [textdata] pakket, goed onderbouwde lexicons kunt downloaden en gebruiken. Hier is een klein stukje van het loughran-lexicon.
| Word | Sentiment |
|---|---|
| abandoned | negative |
| abandoning | negative |
| abandonment | negative |
| abandonments | negative |
| abandons | negative |
Dit lexicon bevat 4150 termen met bijbehorende informatie. We gaan ook andere lexicons verkennen, maar de structuur en de manier om ze op te halen zijn vergelijkbaar.
Laten we tidytext met textdata gebruiken om de woordlabels van andere lexicons te verkennen!
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Subset to AFINN
afinn_lex <- get_sentiments("___")
# Count AFINN scores
afinn_lex %>%
___(value)