Modelle vergleichen
Das beste Modell aus mehreren konkurrierenden Modellen zu wählen, ist schwierig, wenn diese Modelle auf unvollständigen Daten basieren. In dieser Übung erweiterst du das zuvor erstellte Modell um eine weitere erklärende Variable: die „race“ (Ethnie) der dargestellten Person im Film. Danach versuchst du, es mit dem vorherigen Modell zu vergleichen.
Zur Erinnerung, so hast du das erste Modell geschätzt:
model_1 <- lm(earnings ~ country + year + sub_type,
data = biopics)
Schauen wir, ob wir beurteilen können, ob das Hinzufügen der Variable „race“ das Modell verbessert!
Diese Übung ist Teil des Kurses
Fehlende Daten mit Imputationen in R behandeln
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Fit linear regression to predict earnings
model_2 <- ___(___,
___ = ___)