Bessere Modelle bauen

Zuvor hast du eine Sammlung einfacher Modelle gebaut, um life expectancy mithilfe des Features year zu modellieren. Deine frühere Analyse hat gezeigt, dass einige dieser Modelle nicht besonders gut gepasst haben.

In dieser Übung erstellst du für jedes Land multiple Regressionsmodelle unter Verwendung aller verfügbaren Features. Vielleicht möchtest du die Leistung der vier am schlechtesten passenden Modelle vergleichen; ihre adjustierten \(R^2\)-Werte sind unten angegeben:

Country	Adjusted \(R^2\)
Botswana	-0.0060772
Lesotho	-0.0169851
Zambia	0.1668999
Zimbabwe	0.2083979

Diese Übung ist Teil des Kurses

Machine Learning im Tidyverse

Kurs anzeigen

Anleitung zur Übung

Baue für jedes Land ein lineares Modell, das life_expectancy mit allen Features im Datensatz vorhersagt.
Hänge eine Spalte (fit) mit den Gütemaßen jedes Modells an und vereinfache diesen Data Frame.
Gib die adjustierten \(R^2\)-Werte in fullmodel_perf für die vier Länder aus dem Data Frame worst_fit aus.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>% 
  mutate(model = map(data, ~lm(formula = ___, data = .x)))

fullmodel_perf <- gap_fullmodel %>% 
  # Extract the fit statistics of each model into data frames
  mutate(fit = map(model, ~___(.x))) %>% 
  # Simplify the fit data frames for each model
  unnest(___)
  
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>% 
  ___(country %in% worst_fit$country) %>% 
  select(country, adj.r.squared)

Code bearbeiten und ausführen