Modellazione su data frame annidati
Lavorerai sul dataset delle misurazioni corporee dell’esercito statunitense ANSUR II, già caricato come ansur_df. L’obiettivo è annidare i dati per entrambi i sessi in modo da addestrare simultaneamente due modelli lineari, uno per ciascun sesso. Questi modelli ricaveranno il peso di una persona dalla sua statura (altezza) e dalla circonferenza della vita. Poi disanniderai i dati per ispezionare le statistiche dei modelli prodotte dalla funzione glance() del pacchetto broom.
I pacchetti dplyr, broom e purrr sono già stati caricati per te.
Nota a margine: Nel codice fornito, la funzione map() del pacchetto purrr applica funzioni a ciascun data frame annidato. Dai un’occhiata a questo pacchetto se ti piace usare le funzioni nelle pipe!
Questo esercizio fa parte del corso
Rimodellare i dati con tidyr
Istruzioni dell'esercizio
- Raggruppa i dati per
sex. - Annida i dati.
- Disannida la colonna
glanced.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
ansur_df %>%
# Group the data by sex
___ %>%
# Nest the data
___ %>%
mutate(
fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
glanced = map(fit, glance)
) %>%
# Unnest the glanced column
___