Comparer des modèles
Choisir le meilleur parmi plusieurs modèles concurrents peut être délicat lorsque ces modèles sont construits à partir de données incomplètes. Dans cet exercice, vous allez étendre le modèle que vous avez créé précédemment en ajoutant une variable explicative supplémentaire : la race du personnage du film. Ensuite, vous tenterez de le comparer au modèle précédent.
Pour rappel, voici comment vous avez ajusté le premier modèle :
model_1 <- lm(earnings ~ country + year + sub_type,
data = biopics)
Voyons si l’ajout de la variable de race améliore le modèle !
Cet exercice fait partie du cours
Gérer les données manquantes avec des imputations en R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Fit linear regression to predict earnings
model_2 <- ___(___,
___ = ___)