Een eenvoudige bootstrap uitvoeren
Welkom bij de eerste oefening in de bootstrapping-sectie. We lopen een voorbeeld door waarin je leert een eenvoudige bootstrap uit te voeren. Zoals we in de video zagen, is het belangrijkste idee achter bootstrapping steekproeven trekken met teruglegging.
Stel, je hebt een fabriek die steeksleutels produceert. Je wilt de gemiddelde lengte van de sleutels kunnen beschrijven en controleren of ze aan bepaalde specificaties voldoen. Je fabriek produceert elke dag duizenden sleutels, maar het is niet haalbaar om de lengte van elke sleutel te meten. Wel heb je een representatieve steekproef van 100 sleutels. Laten we bootstrapping gebruiken om het 95%-betrouwbaarheidsinterval (BI) voor de gemiddelde lengte te bepalen.
Bekijk in de shell de lijst wrench_lengths, met 100 geobserveerde lengtes van sleutels.
Deze oefening maakt deel uit van de cursus
Statisticale simulatie in Python
Oefeninstructies
- Trek een aselecte steekproef met teruglegging uit
wrench_lengthsen sla die op intemp_sample. Zetsize = len(wrench_lengths). - Bereken de gemiddelde lengte van elke steekproef, ken die toe aan
sample_meanen voeg die vervolgens toe aanmean_lengths. - Bereken het ge-bootstrapte gemiddelde (
boot_mean) en het ge-bootstrapte 95%-betrouwbaarheidsinterval (boot_95_ci) metnp.percentile().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Draw some random sample with replacement and append mean to mean_lengths.
mean_lengths, sims = [], 1000
for i in range(sims):
temp_sample = ____(____, replace=____, size=____)
sample_mean = ____
mean_lengths.append(sample_mean)
# Calculate bootstrapped mean and 95% confidence interval.
boot_mean = np.mean(____)
boot_95_ci = ____(mean_lengths, [2.5, 97.5])
print("Bootstrapped Mean Length = {}, 95% CI = {}".format(boot_mean, boot_95_ci))