IniziaInizia gratis

Modellazione su data frame annidati

Lavorerai sul dataset delle misurazioni corporee dell’esercito statunitense ANSUR II, già caricato come ansur_df. L’obiettivo è annidare i dati per entrambi i sessi in modo da addestrare simultaneamente due modelli lineari, uno per ciascun sesso. Questi modelli ricaveranno il peso di una persona dalla sua statura (altezza) e dalla circonferenza della vita. Poi disanniderai i dati per ispezionare le statistiche dei modelli prodotte dalla funzione glance() del pacchetto broom.

I pacchetti dplyr, broom e purrr sono già stati caricati per te.

Nota a margine: Nel codice fornito, la funzione map() del pacchetto purrr applica funzioni a ciascun data frame annidato. Dai un’occhiata a questo pacchetto se ti piace usare le funzioni nelle pipe!

Questo esercizio fa parte del corso

Rimodellare i dati con tidyr

Visualizza il corso

Istruzioni dell'esercizio

  • Raggruppa i dati per sex.
  • Annida i dati.
  • Disannida la colonna glanced.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

ansur_df %>%
  # Group the data by sex
  ___ %>% 
  # Nest the data
  ___ %>% 
  mutate(
    fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
    glanced = map(fit, glance)
  ) %>% 
  # Unnest the glanced column
  ___
Modifica ed esegui il codice