Tokenização e contagem
Explore o conteúdo dos tweets de companhias aéreas em twitter_data usando contagem de palavras. O conteúdo de cada tweet está na coluna tweet_text.
Este exercício faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercício
- Carregue os pacotes tidyverse e tidytext.
- Tokenize os tweets na coluna
tweet_text. - Calcule a contagem de palavras usando o texto tokenizado.
- Organize as contagens em ordem decrescente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load the tidyverse and tidytext packages
___(___)
___(___)
tidy_twitter <- twitter_data %>%
# Tokenize the twitter data
___(word, ___)
tidy_twitter %>%
# Compute word counts
___(___) %>%
# Arrange the counts in descending order
___(___)