Modellierung auf verschachtelten Data Frames

Du arbeitest mit dem US‑Army‑Datensatz ANSUR II zu Körpermaßen, der als ansur_df vorab geladen wurde. Ziel ist es, die Daten nach beiden Geschlechtern zu verschachteln, sodass du gleichzeitig zwei lineare Modelle trainieren kannst – eines pro Geschlecht. Diese Modelle leiten das Körpergewicht aus Körpergröße (stature/height) und Taillenumfang ab. Danach entpackst du die Daten, um die vom broom‑Paket (Funktion glance()) erzeugten Modellstatistiken zu prüfen.

Die Pakete dplyr, broom und purrr sind bereits geladen.

Nebenbemerkung: Im bereitgestellten Code wendet die map()‑Funktion aus dem purrr‑Paket Funktionen auf jeden verschachtelten Data Frame an. Schau dir dieses Paket an, wenn du gern Funktionen innerhalb von Pipes verwendest!

Diese Übung ist Teil des Kurses

Daten umformen mit tidyr

Kurs anzeigen

Anleitung zur Übung

Gruppiere die Daten nach sex.
Verschachtle die Daten.
Entpacke die Spalte glanced.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

ansur_df %>%
  # Group the data by sex
  ___ %>% 
  # Nest the data
  ___ %>% 
  mutate(
    fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
    glanced = map(fit, glance)
  ) %>% 
  # Unnest the glanced column
  ___

Code bearbeiten und ausführen