Calcolare le misure di centro
In tutto questo capitolo userai i dati di gapminder, che raccolgono nel tempo dati demografici dei paesi del mondo. Per saperne di più, apri la pagina di aiuto con ?gapminder.
Per questo esercizio, concentrati su come la speranza di vita varia da un continente all’altro. Questo richiede di svolgere l’analisi non a livello di paese, ma aggregando al livello di continente. Ciò è reso possibile dalla combinazione di group_by() e summarize(), una sintassi molto potente per effettuare la stessa analisi su diversi sottoinsiemi dell’intero insieme di dati.
Questo esercizio fa parte del corso
Analisi esplorativa dei dati in R
Istruzioni dell'esercizio
- Crea un insieme di dati chiamato
gap2007che contenga solo i dati dell'anno 2007. - Usando
gap2007, calcola media e mediana della speranza di vita per ciascun continente. Non preoccuparti di assegnare nomi alle nuove colonne prodotte dasummarize(). - Conferma le tendenze che osservi nelle mediane generando box plot affiancati della speranza di vita per ciascun continente.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Create dataset of 2007 data
gap2007 <- filter(___, ___)
# Compute groupwise mean and median lifeExp
gap2007 %>%
group_by(___) %>%
summarize(___,
___)
# Generate box plots of lifeExp for each continent
gap2007 %>%
ggplot(aes(x = ___, y = ___)) +
___