Bootstrap des données
Avec le package infer et type = "bootstrap", vous pouvez échantillonner de façon répétée depuis l’ensemble de données pour estimer la distribution d’échantillonnage et l’erreur standard du coefficient de pente. Utiliser cette distribution d’échantillonnage vous permettra de trouver directement un intervalle de confiance pour la pente de la population sous-jacente.
Cet exercice fait partie du cours
Inférence pour la régression linéaire en R
Instructions
Utilisez les étapes de infer pour effectuer un bootstrap des données twins 1000 fois. Vous n’avez pas besoin de hypothesize() car vous créez maintenant des intervalles de confiance, et non un test d’hypothèse !
- Spécifiez
Fosteren fonction deBiological. - Générez
1000réplicats par bootstrap. - Calculez la statistique de pente.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Set the seed for reproducibility
set.seed(4747)
# Calculate 1000 bootstrapped slopes
boot_slope <- twins %>%
# Specify Foster vs. Biological
___ %>%
# Generate 1000 bootstrap replicates
___ %>%
# Calculate the slope statistic
___
# See the result
boot_slope