LOL, dit nummer is wicked good
Zelfs met de wet van Zipf in het spel moet je nog steeds lexicons aanpassen aan de tekstbron (bijvoorbeeld Twitter versus juridische documenten) of de demografie van de auteur (tiener versus oudere). In deze oefening zie je de expliciete componenten van polarity(), zodat je ze indien nodig kunt aanpassen.
In Trey Songz’ nummer "Lol :)" staat de regel "LOL smiley face, LOL smiley face." In de basisfunctie polarity() is "LOL" niet als positief gedefinieerd. Maar "LOL" staat voor "Laugh Out Loud" en zou positief moeten zijn. Daarom moet je het lexicon aanpassen aan de context van de tekst, inclusief popcultuur-slang. Als je analyse tekst bevat uit een specifiek kanaal (Twitters "LOL"), locatie (Bostons "Wicked Good") of leeftijdsgroep (tieners’ "sick"), zul je het lexicon waarschijnlijk moeten bijstellen.
In deze oefening pas je het subjectiviteitslexicon of de qdap-woordenlijsten met valence shifters niet aan. In plaats daarvan bekijk je de bestaande word data frame-objecten, zodat je ze in de volgende oefening kunt wijzigen.
We hebben text gemaakt met twee fragmenten uit de songtekst van Beyoncé’s "Crazy in Love" voor deze oefening.
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Examine the key.pol
___
# Negators
___
# Amplifiers
___
# De-amplifiers
___
# Examine
___