Resumos agrupados
Há mais não-reclamações do que reclamações em twitter_data. Você pode até estar começando a duvidar se esses dados são mesmo do Twitter! Existem outras colunas interessantes em twitter_data que vale a pena explorar antes de analisar os tweets em si. Cada tweet inclui o número de seguidores do usuário na coluna usr_followers_count. Você espera que quem reclama tenha, em média, mais seguidores ou menos seguidores do que quem não reclama? Você pode usar resumos agrupados para responder a isso de forma rápida e fácil.
Este exercício faz parte do curso
Introdução à Análise de Texto em R
Instruções do exercício
- Agrupe os dados por
complaint_label. - Calcule o número médio, mínimo e máximo de
usr_followers_count.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Start with the data frame
___ %>%
# Group the data by whether or not the tweet is a complaint
___(___) %>%
# Compute the mean, min, and max follower counts
summarize(
avg_followers = ___(___),
min_followers = ___(___),
max_followers = ___(___)
)