Exécuter un bootstrap simple
Bienvenue dans le premier exercice de la section dédiée au bootstrapping. Nous allons travailler sur un exemple pour apprendre à exécuter un bootstrap simple. Comme vu dans la vidéo, l’idée principale du bootstrapping est l’échantillonnage avec remise.
Supposons que vous possédiez une usine qui fabrique des clés. Vous souhaitez caractériser la longueur moyenne des clés et vérifier qu’elles respectent certaines spécifications. Votre usine produit des milliers de clés chaque jour, mais il est irréaliste de mesurer la longueur de chacune. En revanche, vous disposez d’un échantillon représentatif de 100 clés. Utilisons le bootstrapping pour obtenir l’intervalle de confiance (IC) à 95 % des longueurs moyennes.
Examinez la liste wrench_lengths, qui contient 100 longueurs observées de clés, dans le terminal.
Cet exercice fait partie du cours
Simulation statistique en Python
Instructions
- Tirez un échantillon aléatoire avec remise à partir de
wrench_lengthset stockez-le danstemp_sample. Définissezsize = len(wrench_lengths). - Calculez la longueur moyenne de chaque échantillon, affectez-la à
sample_mean, puis ajoutez-la àmean_lengths. - Calculez la moyenne bootstrapée (
boot_mean) et l’intervalle de confiance bootstrapé à 95 % (boot_95_ci) en utilisantnp.percentile().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Draw some random sample with replacement and append mean to mean_lengths.
mean_lengths, sims = [], 1000
for i in range(sims):
temp_sample = ____(____, replace=____, size=____)
sample_mean = ____
mean_lengths.append(sample_mean)
# Calculate bootstrapped mean and 95% confidence interval.
boot_mean = np.mean(____)
boot_95_ci = ____(mean_lengths, [2.5, 97.5])
print("Bootstrapped Mean Length = {}, 95% CI = {}".format(boot_mean, boot_95_ci))