Intervalle de confiance sur le taux de matchs sans coup sûr
Reconsidérez les intervalles entre matchs sans coup sûr pour l’ère moderne du baseball. Générez 10 000 réplicats bootstrap du paramètre optimal \(\tau\). Tracez un histogramme de vos réplicats et indiquez un intervalle de confiance à 95 %.
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Générez
10000réplicats bootstrap de \(\tau\) à partir des donnéesnohitter_timesà l’aide de votre fonctiondraw_bs_reps(). Rappelez-vous que le \(\tau\) optimal se calcule comme la moyenne des données. - Calculez l’intervalle de confiance à 95 % avec
np.percentile()en passant deux arguments : le tableaubs_replicateset la liste des percentiles – dans ce cas2.5et97.5. - Affichez l’intervalle de confiance.
- Tracez un histogramme de vos réplicats bootstrap. Cela a déjà été fait pour vous ; cliquez sur Soumettre pour voir le graphique !
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Draw bootstrap replicates of the mean no-hitter time (equal to tau): bs_replicates
bs_replicates = ____
# Compute the 95% confidence interval: conf_int
conf_int = ____
# Print the confidence interval
print('95% confidence interval =', ____, 'games')
# Plot the histogram of the replicates
_ = plt.hist(bs_replicates, bins=50, normed=True)
_ = plt.xlabel(r'$\tau$ (games)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()