Riepiloghi raggruppati

Quindi in twitter_data ci sono più non-reclami che reclami. Potresti iniziare a chiederti se questi dati provengano davvero da Twitter! Ci sono alcune altre colonne interessanti in twitter_data che vale la pena esplorare prima di arrivare ai tweet veri e propri. Ogni tweet include il numero di follower dell’utente nella colonna usr_followers_count. Ti aspetti che chi si lamenta abbia in media più o meno follower rispetto a chi non si lamenta? Puoi usare riepiloghi raggruppati per fornire una risposta rapida e semplice.

Questo esercizio fa parte del corso

Introduzione all'analisi del testo in R

Visualizza corso

Istruzioni dell'esercizio

Raggruppa i dati per complaint_label.
Calcola il numero medio, minimo e massimo di usr_followers_count.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Start with the data frame
___ %>% 
  # Group the data by whether or not the tweet is a complaint
  ___(___) %>% 
  # Compute the mean, min, and max follower counts
  summarize(
    avg_followers = ___(___),
    min_followers = ___(___),
    max_followers = ___(___)
  )

Modifica ed esegui il codice