Modellen vergelijken
De beste kiezen uit meerdere concurrerende modellen kan lastig zijn als die modellen zijn gebouwd op onvolledige data. In deze oefening breid je het model dat je eerder hebt gebouwd uit met nog een extra verklarende variabele: de etniciteit van het onderwerp van de film. Daarna probeer je het te vergelijken met het vorige model.
Ter herinnering: zo heb je het eerste model gefit:
model_1 <- lm(earnings ~ country + year + sub_type,
data = biopics)
Laten we kijken of we kunnen beoordelen of het toevoegen van de variabele voor etniciteit het model verbetert!
Deze oefening maakt deel uit van de cursus
Omgaan met missende data met imputaties in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Fit linear regression to predict earnings
model_2 <- ___(___,
___ = ___)