Aan de slagGa gratis aan de slag

Bootstrap-replicaten van andere statistieken

We zagen in een eerdere oefening dat het gemiddelde Normaal verdeeld is. Dat geldt niet per se voor andere statistieken, maar geen zorgen: als hackers kunnen we altijd bootstrap-replicaten nemen! In deze oefening genereer je bootstrap-replicaten voor de variantie van de jaarlijkse neerslag bij het Sheffield Weather Station en plot je het histogram van de replicaten.

Hier maak je gebruik van de functie draw_bs_reps() die je een paar oefeningen geleden hebt gedefinieerd. Ter referentie staat die hieronder nogmaals:

def draw_bs_reps(data, func, size=1):
    """Draw bootstrap replicates."""
    # Initialize array of replicates
    bs_replicates = np.empty(size)
    # Generate replicates
    for i in range(size):
        bs_replicates[i] = bootstrap_replicate_1d(data, func)
    return bs_replicates

Deze oefening maakt deel uit van de cursus

Statistical Thinking in Python (deel 2)

Cursus bekijken

Oefeninstructies

  • Trek 10000 bootstrap-replicaten van de variantie in jaarlijkse neerslag, opgeslagen in de rainfall-gegevensset, met je functie draw_bs_reps(). Tip: geef np.var door om de variantie te berekenen.
  • Deel je variantie-replicaten (bs_replicates) door 100 om de variantie handig uit te drukken in vierkante centimeters.
  • Maak een histogram van bs_replicates met het argument normed=True en 50 bins.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____

# Put the variance in units of square centimeters
____

# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')

# Show the plot
plt.show()
Code bewerken en uitvoeren