Beste und schlechteste Modellanpassungen
In dieser Übung beantwortest du folgende Fragen:
- Wie gut passen deine Modelle insgesamt zu deinen Daten?
- Welche Modelle passen am besten?
- Welche Modelle passen nicht gut zu den Daten?
Diese Übung ist Teil des Kurses
Machine Learning im Tidyverse
Anleitung zur Übung
- Erstelle ein Histogramm der \(R^2\)-Werte der 77 Modelle
- Extrahiere die 4 am besten passenden Modelle (basierend auf \(R^2\)) und speichere diesen Data Frame als
best_fit - Extrahiere die 4 am schlechtesten passenden Modelle (basierend auf \(R^2\)) und speichere diesen Data Frame als
worst_fit
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Plot a histogram of rsquared for the 77 models
model_perf %>%
ggplot(aes(x = ___)) +
___()
# Extract the 4 best fitting models
best_fit <- model_perf %>%
slice_max(___, n = ___)
# Extract the 4 models with the worst fit
worst_fit <- model_perf %>%
slice_min(___, n = ___)