Exécuter le bootstrap
Bravo pour avoir écrit calc_gender_coef() dans l’exercice précédent ! Cette fonction crée un échantillon bootstrap, l’impute et renvoie le coefficient de la régression linéaire qui décrit l’impact du fait que le sujet du film soit une femme sur les recettes du film.
Dans cet exercice, vous allez utiliser le package boot pour obtenir une distribution bootstrap de ces coefficients. L’étendue de cette distribution reflétera l’incertitude due à l’imputation. Vous examinerez aussi en quoi la distribution bootstrap diffère d’une imputation unique suivie d’une régression. Passons au bootstrapping !
Cet exercice fait partie du cours
Gérer les données manquantes avec des imputations en R
Instructions
- Chargez le package
boot. - Lancez le bootstrapping sur
biopics, en passantcalc_gender_coefcommestatisticet en fixantRà 50 ; affectez le résultat àboot_results. - Utilisez
print()etplot()sur les résultats du bootstrapping.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Load the boot library
___
# Run bootstrapping on biopics data
boot_results <- ___(___, statistic = ___, R = ___)
# Print and plot bootstrapping results
___
___