CommencerCommencer gratuitement

Modéliser sur des data frames imbriqués

Vous allez travailler sur l’ensemble de mesures corporelles de l’US Army ANSUR II, déjà chargé sous le nom ansur_df. L’objectif est d’imbriquer les données pour les deux sexes afin d’entraîner simultanément deux modèles linéaires, un pour chaque sexe. Ces modèles permettront d’estimer le poids d’une personne à partir de sa taille (stature) et de son tour de taille. Vous désimbriquerez ensuite les données pour examiner les statistiques du modèle produites par la fonction glance() du package broom.

Les packages dplyr, broom et purrr ont été préchargés pour vous.

Remarque : dans le code fourni, la fonction map() du package purrr applique des fonctions à chaque data frame imbriqué. Jetez un œil à ce package si vous aimez utiliser des fonctions dans des pipes !

Cet exercice fait partie du cours

Reshaper des données avec tidyr

Afficher le cours

Instructions

  • Regroupez les données par sex.
  • Imbriquez les données.
  • Désimbriquez la colonne glanced.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

ansur_df %>%
  # Group the data by sex
  ___ %>% 
  # Nest the data
  ___ %>% 
  mutate(
    fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
    glanced = map(fit, glance)
  ) %>% 
  # Unnest the glanced column
  ___
Modifier et exécuter le code