Aan de slagGa gratis aan de slag

Tokenizing and counting

Explore the content of the airline tweets in twitter_data through word counts. The content of each tweet is in the tweet_text column.

Deze oefening maakt deel uit van de cursus

Introduction to Text Analysis in R

Cursus bekijken

Oefeninstructies

  • Load the tidyverse and tidytext packages.
  • Tokenize the tweets in the tweet_text column.
  • Compute word counts using the tokenized text.
  • Arrange the counts in descending order.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Load the tidyverse and tidytext packages
___(___)
___(___)

tidy_twitter <- twitter_data %>% 
  # Tokenize the twitter data
  ___(word, ___) 

tidy_twitter %>% 
  # Compute word counts
  ___(___) %>% 
  # Arrange the counts in descending order
  ___(___)
Code bewerken en uitvoeren