CommencerCommencer gratuitement

Exécuter un bootstrap simple

Bienvenue dans le premier exercice de la section dédiée au bootstrapping. Nous allons travailler sur un exemple pour apprendre à exécuter un bootstrap simple. Comme vu dans la vidéo, l’idée principale du bootstrapping est l’échantillonnage avec remise.

Supposons que vous possédiez une usine qui fabrique des clés. Vous souhaitez caractériser la longueur moyenne des clés et vérifier qu’elles respectent certaines spécifications. Votre usine produit des milliers de clés chaque jour, mais il est irréaliste de mesurer la longueur de chacune. En revanche, vous disposez d’un échantillon représentatif de 100 clés. Utilisons le bootstrapping pour obtenir l’intervalle de confiance (IC) à 95 % des longueurs moyennes.

Examinez la liste wrench_lengths, qui contient 100 longueurs observées de clés, dans le terminal.

Cet exercice fait partie du cours

Simulation statistique en Python

Afficher le cours

Instructions

  • Tirez un échantillon aléatoire avec remise à partir de wrench_lengths et stockez-le dans temp_sample. Définissez size = len(wrench_lengths).
  • Calculez la longueur moyenne de chaque échantillon, affectez-la à sample_mean, puis ajoutez-la à mean_lengths.
  • Calculez la moyenne bootstrapée (boot_mean) et l’intervalle de confiance bootstrapé à 95 % (boot_95_ci) en utilisant np.percentile().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Draw some random sample with replacement and append mean to mean_lengths.
mean_lengths, sims = [], 1000
for i in range(sims):
    temp_sample = ____(____, replace=____, size=____)
    sample_mean = ____
    mean_lengths.append(sample_mean)
    
# Calculate bootstrapped mean and 95% confidence interval.
boot_mean = np.mean(____)
boot_95_ci = ____(mean_lengths, [2.5, 97.5])
print("Bootstrapped Mean Length = {}, 95% CI = {}".format(boot_mean, boot_95_ci))
Modifier et exécuter le code