Bessere Modelle bauen
Zuvor hast du eine Sammlung einfacher Modelle gebaut, um life expectancy mithilfe des Features year zu modellieren. Deine frühere Analyse hat gezeigt, dass einige dieser Modelle nicht besonders gut gepasst haben.
In dieser Übung erstellst du für jedes Land multiple Regressionsmodelle unter Verwendung aller verfügbaren Features. Vielleicht möchtest du die Leistung der vier am schlechtesten passenden Modelle vergleichen; ihre adjustierten \(R^2\)-Werte sind unten angegeben:
| Country | Adjusted \(R^2\) |
|---|---|
| Botswana | -0.0060772 |
| Lesotho | -0.0169851 |
| Zambia | 0.1668999 |
| Zimbabwe | 0.2083979 |
Diese Übung ist Teil des Kurses
Machine Learning im Tidyverse
Anleitung zur Übung
- Baue für jedes Land ein lineares Modell, das
life_expectancymit allen Features im Datensatz vorhersagt. - Hänge eine Spalte (
fit) mit den Gütemaßen jedes Modells an und vereinfache diesen Data Frame. - Gib die adjustierten \(R^2\)-Werte in
fullmodel_perffür die vier Länder aus dem Data Frameworst_fitaus.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Build a linear model for each country using all features
gap_fullmodel <- gap_nested %>%
mutate(model = map(data, ~lm(formula = ___, data = .x)))
fullmodel_perf <- gap_fullmodel %>%
# Extract the fit statistics of each model into data frames
mutate(fit = map(model, ~___(.x))) %>%
# Simplify the fit data frames for each model
unnest(___)
# View the performance for the four countries with the worst fitting four simple models you looked at before
fullmodel_perf %>%
___(country %in% worst_fit$country) %>%
select(country, adj.r.squared)