Modellierung auf verschachtelten Data Frames
Du arbeitest mit dem US‑Army‑Datensatz ANSUR II zu Körpermaßen, der als ansur_df vorab geladen wurde. Ziel ist es, die Daten nach beiden Geschlechtern zu verschachteln, sodass du gleichzeitig zwei lineare Modelle trainieren kannst – eines pro Geschlecht. Diese Modelle leiten das Körpergewicht aus Körpergröße (stature/height) und Taillenumfang ab. Danach entpackst du die Daten, um die vom broom‑Paket (Funktion glance()) erzeugten Modellstatistiken zu prüfen.
Die Pakete dplyr, broom und purrr sind bereits geladen.
Nebenbemerkung: Im bereitgestellten Code wendet die map()‑Funktion aus dem purrr‑Paket Funktionen auf jeden verschachtelten Data Frame an. Schau dir dieses Paket an, wenn du gern Funktionen innerhalb von Pipes verwendest!
Diese Übung ist Teil des Kurses
Daten umformen mit tidyr
Anleitung zur Übung
- Gruppiere die Daten nach
sex. - Verschachtle die Daten.
- Entpacke die Spalte
glanced.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
ansur_df %>%
# Group the data by sex
___ %>%
# Nest the data
___ %>%
mutate(
fit = map(data, function(df) lm(weight_kg ~ waist_circum_m + stature_m, data = df)),
glanced = map(fit, glance)
) %>%
# Unnest the glanced column
___