L’histogramme du bootstrap
Vous envisagez des vacances à Cincinnati en mai, mais vous êtes très sensible au NO2. Vous récupérez quelques années de données de pollution à Cincinnati en mai et examinez une estimation bootstrap des niveaux moyens de NO2. Comme vous ne disposez que d’une seule estimation, la meilleure manière de visualiser les résultats de vos estimations bootstrap est un histogramme.
Même si vous trouvez l’histogramme bootstrap parlant en soi, votre partenaire, qui partira avec vous, préfère voir des intervalles en pourcentage. Pour l’en satisfaire, vous décidez de mettre en évidence l’intervalle à 95 % en ombrant la zone correspondante.
Cet exercice fait partie du cours
Améliorer vos visualisations de données en Python
Instructions
- Fournissez à la fonction
percentile()les percentiles inférieur et supérieur nécessaires pour obtenir un intervalle à 95 %. - Ombrer l’arrière-plan du graphique sur l’intervalle à 95 %.
- Tracer l’histogramme des moyennes bootstrap avec 100 classes.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
cinci_may_NO2 = pollution.query("city == 'Cincinnati' & month == 5").NO2
# Generate bootstrap samples
boot_means = bootstrap(cinci_may_NO2, 1000)
# Get lower and upper 95% interval bounds
lower, upper = np.percentile(boot_means, [____, ____])
# Plot shaded area for interval
plt.axvspan(____, ____, color = 'gray', alpha = 0.2)
# Draw histogram of bootstrap samples
sns.histplot(____, ____ = 100)
plt.show()