Aan de slagGa gratis aan de slag

Modelleren op geneste dataframes

Je werkt met de US Army ANSUR II dataset met lichaamsmetingen, die al is ingeladen als ansur_df. Het doel is om de data voor beide seksen te nesten, zodat je twee lineaire modellen tegelijk kunt trainen, één voor elke sekse. Deze modellen leiden iemands gewicht af uit zijn/haar lengte (stature/height) en omvang van de taille. Daarna ga je de data weer un-nesten om de modelstatistieken te bekijken die zijn gemaakt door de functie glance() uit het broom-pakket.

De pakketten dplyr, broom en purrr zijn al voor je ingeladen.

Terzijde: In de meegeleverde code past de functie map() uit het purrr-pakket functies toe op elk genest dataframe. Neem dit pakket eens door als je graag functies binnen pipes gebruikt!

Deze oefening maakt deel uit van de cursus

Data herstructureren met tidyr

Cursus bekijken

Oefeninstructies

  • Groepeer de data op sex.
  • Nest de data.
  • Unnest de kolom glanced.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

ansur_df %>%
  # Group the data by sex
  ___ %>% 
  # Nest the data
  ___ %>% 
  mutate(
    fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
    glanced = map(fit, glance)
  ) %>% 
  # Unnest the glanced column
  ___
Code bewerken en uitvoeren