IniziaInizia gratis

Calcolare le misure di dispersione

Estendiamo la potente sintassi di group_by() e summarize() alle misure di dispersione. Se non sei sicuro che le distribuzioni siano simmetriche o asimmetriche, è una buona idea considerare una misura robusta come l'IQR oltre alle consuete misure di varianza o deviazione standard.

Questo esercizio fa parte del corso

Analisi esplorativa dei dati in R

Visualizza il corso

Istruzioni dell'esercizio

Il dataset gap2007 che hai creato in un esercizio precedente è disponibile nel tuo workspace.

  • Per ciascun continente in gap2007, riassumi le aspettative di vita usando sd(), IQR() e il conteggio dei paesi, n(). Non è necessario assegnare nomi alle nuove colonne prodotte qui. La funzione n() all'interno della tua chiamata a summarize() non richiede argomenti.
  • Confronta graficamente la dispersione di queste distribuzioni costruendo dei grafici di densità sovrapposti dell'aspettativa di vita suddivisi per continente.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Compute groupwise measures of spread
gap2007 %>%
  group_by(___) %>%
  summarize(___,
            ___,
            ___)

# Generate overlaid density plots
gap2007 %>%
  ggplot(aes(x = ___, fill = ___)) +
  geom_density(alpha = 0.3)
Modifica ed esegui il codice