Modéliser sur des data frames imbriqués
Vous allez travailler sur l’ensemble de mesures corporelles de l’US Army ANSUR II, déjà chargé sous le nom ansur_df. L’objectif est d’imbriquer les données pour les deux sexes afin d’entraîner simultanément deux modèles linéaires, un pour chaque sexe. Ces modèles permettront d’estimer le poids d’une personne à partir de sa taille (stature) et de son tour de taille. Vous désimbriquerez ensuite les données pour examiner les statistiques du modèle produites par la fonction glance() du package broom.
Les packages dplyr, broom et purrr ont été préchargés pour vous.
Remarque : dans le code fourni, la fonction map() du package purrr applique des fonctions à chaque data frame imbriqué. Jetez un œil à ce package si vous aimez utiliser des fonctions dans des pipes !
Cet exercice fait partie du cours
Reshaper des données avec tidyr
Instructions
- Regroupez les données par
sex. - Imbriquez les données.
- Désimbriquez la colonne
glanced.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
ansur_df %>%
# Group the data by sex
___ %>%
# Nest the data
___ %>%
mutate(
fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
glanced = map(fit, glance)
) %>%
# Unnest the glanced column
___