Riepiloghi raggruppati
Quindi in twitter_data ci sono più non-reclami che reclami. Potresti iniziare a chiederti se questi dati provengano davvero da Twitter! Ci sono alcune altre colonne interessanti in twitter_data che vale la pena esplorare prima di arrivare ai tweet veri e propri. Ogni tweet include il numero di follower dell’utente nella colonna usr_followers_count. Ti aspetti che chi si lamenta abbia in media più o meno follower rispetto a chi non si lamenta? Puoi usare riepiloghi raggruppati per fornire una risposta rapida e semplice.
Questo esercizio fa parte del corso
Introduzione all'analisi del testo in R
Istruzioni dell'esercizio
- Raggruppa i dati per
complaint_label. - Calcola il numero medio, minimo e massimo di
usr_followers_count.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Start with the data frame
___ %>%
# Group the data by whether or not the tweet is a complaint
___(___) %>%
# Compute the mean, min, and max follower counts
summarize(
avg_followers = ___(___),
min_followers = ___(___),
max_followers = ___(___)
)