ComeçarComece de graça

Resumos agrupados

Há mais não-reclamações do que reclamações em twitter_data. Você pode até estar começando a duvidar se esses dados são mesmo do Twitter! Existem outras colunas interessantes em twitter_data que vale a pena explorar antes de analisar os tweets em si. Cada tweet inclui o número de seguidores do usuário na coluna usr_followers_count. Você espera que quem reclama tenha, em média, mais seguidores ou menos seguidores do que quem não reclama? Você pode usar resumos agrupados para responder a isso de forma rápida e fácil.

Este exercício faz parte do curso

Introdução à Análise de Texto em R

Ver curso

Instruções do exercício

  • Agrupe os dados por complaint_label.
  • Calcule o número médio, mínimo e máximo de usr_followers_count.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Start with the data frame
___ %>% 
  # Group the data by whether or not the tweet is a complaint
  ___(___) %>% 
  # Compute the mean, min, and max follower counts
  summarize(
    avg_followers = ___(___),
    min_followers = ___(___),
    max_followers = ___(___)
  )
Editar e executar o código