Modelle vergleichen
Das beste Modell aus mehreren konkurrierenden Modellen zu wählen, ist schwierig, wenn diese Modelle auf unvollständigen Daten basieren. In dieser Übung erweiterst du das zuvor erstellte Modell um eine weitere erklärende Variable: die „race“ (Ethnie) der dargestellten Person im Film. Danach versuchst du, es mit dem vorherigen Modell zu vergleichen.
Zur Erinnerung, so hast du das erste Modell geschätzt:
model_1 <- lm(earnings ~ country + year + sub_type,
data = biopics)
Schauen wir, ob wir beurteilen können, ob das Hinzufügen der Variable „race“ das Modell verbessert!
Diese Übung ist Teil des Kurses
<Kurs>Fehlende Daten mit Imputationen in R behandeln</Kurs>Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Fit linear regression to predict earnings
model_2 <- ___(___,
___ = ___)