Dados de tweets sobre companhias aéreas
O data frame twitter_data tem mais de 7.000 tweets sobre companhias aéreas. Os tweets já foram classificados como reclamações ou não na coluna complaint_label. Vamos ter uma ideia de quantos desses tweets são reclamações.
Fique atento: estes são dados reais do Twitter e, por isso, há sempre o risco de conterem palavrões ou outro conteúdo ofensivo (neste exercício e em quaisquer exercícios seguintes que também usem dados reais do Twitter).
Este exercício faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercício
- Carregue o pacote
tidyverse. - Tenha uma noção do tamanho e do conteúdo dos dados imprimindo
twitter_data. - Filtre
twitter_datapara ficar apenas com as reclamações. Quantas reclamações há nos dados?
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Load the tidyverse packages
___(___)
# Print twitter_data
___
# Print just the complaints in twitter_data
twitter_data %>%
___(___ == ___)