Calcolare le misure di dispersione
Estendiamo la potente sintassi di group_by() e summarize() alle misure di dispersione. Se non sei sicuro che le distribuzioni siano simmetriche o asimmetriche, è una buona idea considerare una misura robusta come l'IQR oltre alle consuete misure di varianza o deviazione standard.
Questo esercizio fa parte del corso
Analisi esplorativa dei dati in R
Istruzioni dell'esercizio
Il dataset gap2007 che hai creato in un esercizio precedente è disponibile nel tuo workspace.
- Per ciascun continente in
gap2007, riassumi le aspettative di vita usandosd(),IQR()e il conteggio dei paesi,n(). Non è necessario assegnare nomi alle nuove colonne prodotte qui. La funzionen()all'interno della tua chiamata asummarize()non richiede argomenti. - Confronta graficamente la dispersione di queste distribuzioni costruendo dei grafici di densità sovrapposti dell'aspettativa di vita suddivisi per continente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute groupwise measures of spread
gap2007 %>%
group_by(___) %>%
summarize(___,
___,
___)
# Generate overlaid density plots
gap2007 %>%
ggplot(aes(x = ___, fill = ___)) +
geom_density(alpha = 0.3)