Aan de slagGa gratis aan de slag

Aan de slag! Visualiseer polariteit

Sentimentanalyse helpt je de gevoelens van een auteur over een onderwerp te achterhalen. In deze oefening krijg je alvast een voorproefje!

We hebben text_df gemaakt, een weergave van een gesprek met de kolommen person en text.

Gebruik de functie polarity() uit qdap om text_df te scoren. polarity() accepteert een enkel karakterobject of een data frame met een groeperingsvariabele om een positieve of negatieve score te berekenen.

In dit voorbeeld gebruik je de dollar-pipe-operator %$% uit het pakket magrittr. Het dollarteken stuurt het data frame door naar polarity(), en je geeft een tekstkolomnaam of de tekstkolom én een groeperingsvariabele op, zonder aanhalingstekens.

text_data_frame %$% polarity(text_column_name)

Om een object te maken met de dollar-operator:

polarity_object <- text_data_frame %$% 
  polarity(text_column_name, grouping_column_name)

Concreter: om een kwantitatief oordeel te vellen over het sentiment van tekst, moet je er een score aan toekennen. Een eenvoudige methode is een positieve of negatieve waarde, gekoppeld aan een zin, passage of een verzameling documenten (een corpus). Scoren met alleen positieve of negatieve waarden heet "polariteit". Een handige functie om polariteitsscores uit te lezen is counts(), toegepast op het polariteitsobject. Voor een snelle visualisatie roep je plot() aan op het resultaat van polarity().

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in R

Cursus bekijken

Oefeninstructies

  • Bekijk het conversie-dataframe text_df.
  • Gebruik %$% om text_df door te geven aan polarity() samen met de kolomnaam text zonder aanhalingstekens. Dit print de polariteit voor alle tekst.
  • Maak een nieuw object datacamp_conversation door text_df met %$% door te sturen naar polarity(). Geef text door, gevolgd door de groeperingskolom person. Dit berekent de polariteit per persoon. Omdat alles binnen haakjes staat, wordt het resultaat ook geprint.
  • Pas counts() toe op datacamp_conversation om de specifieke emotionele woorden te printen die zijn gevonden.
  • plot() het object datacamp_conversation.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Examine the text data
text_df

# Calc overall polarity score
text_df %$% polarity(___)

# Calc polarity score by person
(datacamp_conversation <- text_df %$% ___(___, ___))

# Counts table from datacamp_conversation
___(___)

# Plot the conversation polarity
___(___)
Code bewerken en uitvoeren