Bootstrap des données

Avec le package infer et type = "bootstrap", vous pouvez échantillonner de façon répétée depuis l’ensemble de données pour estimer la distribution d’échantillonnage et l’erreur standard du coefficient de pente. Utiliser cette distribution d’échantillonnage vous permettra de trouver directement un intervalle de confiance pour la pente de la population sous-jacente.

Cet exercice fait partie du cours

<cours>Inférence pour la régression linéaire en R</cours>

Voir le cours

Instructions de l’exercice

Utilisez les étapes de infer pour effectuer un bootstrap des données twins 1000 fois. Vous n’avez pas besoin de hypothesize() car vous créez maintenant des intervalles de confiance, et non un test d’hypothèse !

Spécifiez Foster en fonction de Biological.
Générez 1000 réplicats par bootstrap.
Calculez la statistique de pente.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Set the seed for reproducibility
set.seed(4747)

# Calculate 1000 bootstrapped slopes
boot_slope <- twins %>%
  # Specify Foster vs. Biological
  ___ %>%
  # Generate 1000 bootstrap replicates
  ___ %>%
  # Calculate the slope statistic
  ___

# See the result  
boot_slope

Modifier et exécuter le code