Bootstrap-replicaten van andere statistieken
We zagen in een eerdere oefening dat het gemiddelde Normaal verdeeld is. Dat geldt niet per se voor andere statistieken, maar geen zorgen: als hackers kunnen we altijd bootstrap-replicaten nemen! In deze oefening genereer je bootstrap-replicaten voor de variantie van de jaarlijkse neerslag bij het Sheffield Weather Station en plot je het histogram van de replicaten.
Hier maak je gebruik van de functie draw_bs_reps() die je een paar oefeningen geleden hebt gedefinieerd. Ter referentie staat die hieronder nogmaals:
def draw_bs_reps(data, func, size=1):
"""Draw bootstrap replicates."""
# Initialize array of replicates
bs_replicates = np.empty(size)
# Generate replicates
for i in range(size):
bs_replicates[i] = bootstrap_replicate_1d(data, func)
return bs_replicates
Deze oefening maakt deel uit van de cursus
Statistical Thinking in Python (deel 2)
Oefeninstructies
- Trek
10000bootstrap-replicaten van de variantie in jaarlijkse neerslag, opgeslagen in derainfall-gegevensset, met je functiedraw_bs_reps(). Tip: geefnp.vardoor om de variantie te berekenen. - Deel je variantie-replicaten (
bs_replicates) door100om de variantie handig uit te drukken in vierkante centimeters. - Maak een histogram van
bs_replicatesmet het argumentnormed=Trueen50bins.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____
# Put the variance in units of square centimeters
____
# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()