Aan de slagGa gratis aan de slag

Een eenvoudige bootstrap uitvoeren

Welkom bij de eerste oefening in de bootstrapping-sectie. We lopen een voorbeeld door waarin je leert een eenvoudige bootstrap uit te voeren. Zoals we in de video zagen, is het belangrijkste idee achter bootstrapping steekproeven trekken met teruglegging.

Stel, je hebt een fabriek die steeksleutels produceert. Je wilt de gemiddelde lengte van de sleutels kunnen beschrijven en controleren of ze aan bepaalde specificaties voldoen. Je fabriek produceert elke dag duizenden sleutels, maar het is niet haalbaar om de lengte van elke sleutel te meten. Wel heb je een representatieve steekproef van 100 sleutels. Laten we bootstrapping gebruiken om het 95%-betrouwbaarheidsinterval (BI) voor de gemiddelde lengte te bepalen.

Bekijk in de shell de lijst wrench_lengths, met 100 geobserveerde lengtes van sleutels.

Deze oefening maakt deel uit van de cursus

Statisticale simulatie in Python

Cursus bekijken

Oefeninstructies

  • Trek een aselecte steekproef met teruglegging uit wrench_lengths en sla die op in temp_sample. Zet size = len(wrench_lengths).
  • Bereken de gemiddelde lengte van elke steekproef, ken die toe aan sample_mean en voeg die vervolgens toe aan mean_lengths.
  • Bereken het ge-bootstrapte gemiddelde (boot_mean) en het ge-bootstrapte 95%-betrouwbaarheidsinterval (boot_95_ci) met np.percentile().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Draw some random sample with replacement and append mean to mean_lengths.
mean_lengths, sims = [], 1000
for i in range(sims):
    temp_sample = ____(____, replace=____, size=____)
    sample_mean = ____
    mean_lengths.append(sample_mean)
    
# Calculate bootstrapped mean and 95% confidence interval.
boot_mean = np.mean(____)
boot_95_ci = ____(mean_lengths, [2.5, 97.5])
print("Bootstrapped Mean Length = {}, 95% CI = {}".format(boot_mean, boot_95_ci))
Code bewerken en uitvoeren