Aan de slagGa gratis aan de slag

Bing tidy-polariteit: eenvoudig voorbeeld

Nu je de basis van een inner join begrijpt, passen we dit toe op het "Bing"-lexicon. Onthoud dat de functie inner_join() uit dplyr komt en dat je het lexiconobject ophaalt met de get_sentiments()-functie van tidytext.

Het Bing-lexicon labelt woorden als positief of negatief. In de volgende drie oefeningen ga je met dit specifieke lexicon aan de slag. Om get_sentiments() te gebruiken, geef je een string door zoals "afinn", "bing", "nrc" of "loughran" om het betreffende lexicon te downloaden.

De inner join-werkwijze:

  • Haal het juiste lexicon op met get_sentiments().
  • Geef het lexicon en de tidy tekstgegevens door aan inner_join().
  • Voor inner_join() moet er een gedeelde kolomnaam zijn. Als die er niet is, geef je die op met een extra parameter, by gelijk aan c met kolomnamen zoals hieronder.
object <- x %>% 
    inner_join(y, by = c("column_from_x" = "column_from_y"))
  • Voer vervolgens aggregatie en analyse uit op de doorsnede van de tabellen.

Deze oefening maakt deel uit van de cursus

Sentimentanalyse in R

Cursus bekijken

Oefeninstructies

We hebben ag_txt geladen met de eerste 100 regels uit Agamemnon en ag_tidy, de tidy-versie.

  • Gebruik ter vergelijking polarity() op ag_txt.
  • Haal het "bing"-lexicon op door die string door te geven aan get_sentiments().
  • Voer een inner_join() uit met ag_tidy en bing.
    • De woordkolommen heten "term" in ag_tidy en "word" in het lexicon, dus geef het by-argument op.
    • Noem het nieuwe object ag_bing_words.
  • Print ag_bing_words en bekijk een paar van de woorden in het resultaat.
  • Geef ag_bing_words door aan count() van sentiment met de pipe-operator %>%. Vergelijk de polarity()-score met de verhouding van het aantal sentimenten.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Qdap polarity
___

# Get Bing lexicon
bing <- get_sentiments("___")

# Join text to lexicon
ag_bing_words <- ___(___, ___, by = c("___" = "___"))

# Examine
ag_bing_words

# Get counts by sentiment
ag_bing_words %>%
  ___(___)
Code bewerken en uitvoeren