Tokenizen en tellen
Verken de inhoud van de airline-tweets in twitter_data met woordfrequenties. De inhoud van elke tweet staat in de kolom tweet_text.
Deze oefening maakt deel uit van de cursus
Introductie tot tekstanalyse in R
Oefeninstructies
- Laad de pakketten tidyverse en tidytext.
- Tokenize de tweets in de kolom
tweet_text. - Bereken woordfrequenties met de getokenizede tekst.
- Sorteer de tellingen in aflopende volgorde.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the tidyverse and tidytext packages
___(___)
___(___)
tidy_twitter <- twitter_data %>%
# Tokenize the twitter data
___(word, ___)
tidy_twitter %>%
# Compute word counts
___(___) %>%
# Arrange the counts in descending order
___(___)