Ongelukkig einde? Chronologische polariteit
Soms wil je sentiment over de tijd volgen. Tijdens een reclamecampagne kun je bijvoorbeeld het merksentiment bijhouden om het effect van de campagne te zien. Aan het einde van het vorige hoofdstuk zag je hier al een paar voorbeelden van.
In deze oefening loop je de workflow nog eens door om sentiment in de tijd te verkennen met de roman Moby Dick. Je mag verwachten dat vrolijke momenten in het boek meer positieve woorden bevatten dan negatieve. Omgekeerd gebruiken duistere momenten en droevige eindes meer negatieve taal. Je ziet ook een paar trucjes om je sentiment-tijdreeks visueel aantrekkelijker te maken.
De workflow is als volgt:
- Inner join de tekst met het lexicon op woord.
- Tel de sentiments per regel.
- Hervorm de data zodat elk sentiment een eigen kolom krijgt.
- (Afhankelijk van het lexicon) Bereken de polariteit als positieve score min negatieve score.
- Visualiseer de polariteitstijdreeks.
Deze oefening zal bekend voorkomen: het is een uitbreiding op Bing tidy polarity: Call me Ishmael (with ggplot2)!.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
moby_polarity <- moby %>%
# Inner join to the lexicon
___(___, by = c("___" = "___")) %>%
# Count by sentiment, index
___(___, ___) %>%
# Pivot sentiments wider
___(names_from = ___, values_from = ___, values_fill = ___) %>%
mutate(
# Add polarity field
___ = ___ - ___,
# Add line number field
___ = ___()
)