Confrontare i modelli
Scegliere il migliore tra più modelli in competizione può essere complicato se questi modelli sono costruiti su dati incompleti. In questo esercizio estenderai il modello che hai costruito in precedenza aggiungendo un'ulteriore variabile esplicativa: la razza del soggetto del film. Poi proverai a confrontarlo con il modello precedente.
Per ricordarti, ecco come hai stimato il primo modello:
model_1 <- lm(earnings ~ country + year + sub_type,
data = biopics)
Vediamo se possiamo capire se aggiungere la variabile sulla razza migliora il modello!
Questo esercizio fa parte del corso
Gestione dei dati mancanti con imputazioni in R
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Fit linear regression to predict earnings
model_2 <- ___(___,
___ = ___)