Répliques bootstrap d’autres statistiques
Nous avons vu dans un exercice précédent que la moyenne suit une loi Normale. Ce n’est pas forcément le cas pour d’autres statistiques, mais pas d’inquiétude : en bons hackers, nous pouvons toujours prendre des répliques bootstrap ! Dans cet exercice, vous allez générer des répliques bootstrap pour la variance des précipitations annuelles à la station météo de Sheffield et tracer l’histogramme des répliques.
Ici, vous allez réutiliser la fonction draw_bs_reps() que vous avez définie il y a quelques exercices. Elle est fournie ci-dessous pour référence :
def draw_bs_reps(data, func, size=1):
"""Draw bootstrap replicates."""
# Initialize array of replicates
bs_replicates = np.empty(size)
# Generate replicates
for i in range(size):
bs_replicates[i] = bootstrap_replicate_1d(data, func)
return bs_replicates
Cet exercice fait partie du cours
Réflexion statistique en Python (Partie 2)
Instructions
- Tirez
10000répliques bootstrap de la variance des précipitations annuelles, stockées dans l’ensemblerainfall, en utilisant votre fonctiondraw_bs_reps(). Indice : passeznp.varpour calculer la variance. - Divisez vos répliques de variance (
bs_replicates) par100pour exprimer la variance en centimètres carrés, par commodité. - Créez un histogramme de
bs_replicatesen utilisant l’argumentnormed=Trueet50bins.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____
# Put the variance in units of square centimeters
____
# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()