Obesità vs. aspettativa di vita (WHO)
Ti è stato fornito un campione di dati WHO (who_df) con le percentuali di obesità e i dati sull’aspettativa di vita per paese, anno e sesso. Vuoi ispezionare visivamente la correlazione tra obesità e aspettativa di vita.
Tuttavia, i dati sono molto disordinati, con quattro variabili nascoste nei nomi delle colonne. Ogni nome di colonna è composto da tre parti separate da underscore: prima i valori per year, poi quelli per sex, e infine i valori per pct.obese oppure life.exp. Poiché la terza parte del nome della colonna contiene due variabili, dovrai usare il valore speciale ".value" nell’argomento names_to.
Eseguirai il pivot dei dati in un formato ordinato e creerai lo scatter plot.
Il pacchetto ggplot2 è già stato caricato per te.
Questo esercizio fa parte del corso
Rimodellare i dati con tidyr
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
who_df %>%
# Put each variable in its own column
___(
___,
names_to = ___,
names_sep = "_",
names_transform = ___(___ = ___)
)