ComeçarComece de graça

Tokenização e contagem

Explore o conteúdo dos tweets de companhias aéreas em twitter_data usando contagem de palavras. O conteúdo de cada tweet está na coluna tweet_text.

Este exercício faz parte do curso

Introdução à Análise de Texto em R

Ver curso

Instruções do exercício

  • Carregue os pacotes tidyverse e tidytext.
  • Tokenize os tweets na coluna tweet_text.
  • Calcule a contagem de palavras usando o texto tokenizado.
  • Organize as contagens em ordem decrescente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Load the tidyverse and tidytext packages
___(___)
___(___)

tidy_twitter <- twitter_data %>% 
  # Tokenize the twitter data
  ___(word, ___) 

tidy_twitter %>% 
  # Compute word counts
  ___(___) %>% 
  # Arrange the counts in descending order
  ___(___)
Editar e executar o código