CommencerCommencer gratuitement

Répliques bootstrap d’autres statistiques

Nous avons vu dans un exercice précédent que la moyenne suit une loi Normale. Ce n’est pas forcément le cas pour d’autres statistiques, mais pas d’inquiétude : en bons hackers, nous pouvons toujours prendre des répliques bootstrap ! Dans cet exercice, vous allez générer des répliques bootstrap pour la variance des précipitations annuelles à la station météo de Sheffield et tracer l’histogramme des répliques.

Ici, vous allez réutiliser la fonction draw_bs_reps() que vous avez définie il y a quelques exercices. Elle est fournie ci-dessous pour référence :

def draw_bs_reps(data, func, size=1):
    """Draw bootstrap replicates."""
    # Initialize array of replicates
    bs_replicates = np.empty(size)
    # Generate replicates
    for i in range(size):
        bs_replicates[i] = bootstrap_replicate_1d(data, func)
    return bs_replicates

Cet exercice fait partie du cours

Réflexion statistique en Python (Partie 2)

Afficher le cours

Instructions

  • Tirez 10000 répliques bootstrap de la variance des précipitations annuelles, stockées dans l’ensemble rainfall, en utilisant votre fonction draw_bs_reps(). Indice : passez np.var pour calculer la variance.
  • Divisez vos répliques de variance (bs_replicates) par 100 pour exprimer la variance en centimètres carrés, par commodité.
  • Créez un histogramme de bs_replicates en utilisant l’argument normed=True et 50 bins.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____

# Put the variance in units of square centimeters
____

# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')

# Show the plot
plt.show()
Modifier et exécuter le code