Aan de slag! Visualiseer polariteit
Sentimentanalyse helpt je de gevoelens van een auteur over een onderwerp te achterhalen. In deze oefening krijg je alvast een voorproefje!
We hebben text_df gemaakt, een weergave van een gesprek met de kolommen person en text.
Gebruik de functie polarity() uit qdap om text_df te scoren. polarity() accepteert een enkel karakterobject of een data frame met een groeperingsvariabele om een positieve of negatieve score te berekenen.
In dit voorbeeld gebruik je de dollar-pipe-operator %$% uit het pakket magrittr. Het dollarteken stuurt het data frame door naar polarity(), en je geeft een tekstkolomnaam of de tekstkolom én een groeperingsvariabele op, zonder aanhalingstekens.
text_data_frame %$% polarity(text_column_name)
Om een object te maken met de dollar-operator:
polarity_object <- text_data_frame %$%
polarity(text_column_name, grouping_column_name)
Concreter: om een kwantitatief oordeel te vellen over het sentiment van tekst, moet je er een score aan toekennen. Een eenvoudige methode is een positieve of negatieve waarde, gekoppeld aan een zin, passage of een verzameling documenten (een corpus). Scoren met alleen positieve of negatieve waarden heet "polariteit". Een handige functie om polariteitsscores uit te lezen is counts(), toegepast op het polariteitsobject. Voor een snelle visualisatie roep je plot() aan op het resultaat van polarity().
Deze oefening maakt deel uit van de cursus
Sentimentanalyse in R
Oefeninstructies
- Bekijk het conversie-dataframe
text_df. - Gebruik
%$%omtext_dfdoor te geven aanpolarity()samen met de kolomnaamtextzonder aanhalingstekens. Dit print de polariteit voor alle tekst. - Maak een nieuw object
datacamp_conversationdoortext_dfmet%$%door te sturen naarpolarity(). Geeftextdoor, gevolgd door de groeperingskolomperson. Dit berekent de polariteit per persoon. Omdat alles binnen haakjes staat, wordt het resultaat ook geprint. - Pas
counts()toe opdatacamp_conversationom de specifieke emotionele woorden te printen die zijn gevonden. plot()het objectdatacamp_conversation.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Examine the text data
text_df
# Calc overall polarity score
text_df %$% polarity(___)
# Calc polarity score by person
(datacamp_conversation <- text_df %$% ___(___, ___))
# Counts table from datacamp_conversation
___(___)
# Plot the conversation polarity
___(___)