Aan de slagGa gratis aan de slag

Tokenizen en tellen

Verken de inhoud van de airline-tweets in twitter_data met woordfrequenties. De inhoud van elke tweet staat in de kolom tweet_text.

Deze oefening maakt deel uit van de cursus

Introductie tot tekstanalyse in R

Cursus bekijken

Oefeninstructies

  • Laad de pakketten tidyverse en tidytext.
  • Tokenize de tweets in de kolom tweet_text.
  • Bereken woordfrequenties met de getokenizede tekst.
  • Sorteer de tellingen in aflopende volgorde.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the tidyverse and tidytext packages
___(___)
___(___)

tidy_twitter <- twitter_data %>% 
  # Tokenize the twitter data
  ___(word, ___) 

tidy_twitter %>% 
  # Compute word counts
  ___(___) %>% 
  # Arrange the counts in descending order
  ___(___)
Code bewerken en uitvoeren