Basis jackknife-schatting - gemiddelde
Jackknife-resampling is een oudere methode en wordt minder vaak gebruikt dan bootstrapping. Toch is het nuttig om te weten hoe je een eenvoudige jackknife-schatting uitvoert. In deze eerste oefening berekenen we de jackknife-schatting voor het gemiddelde. We gaan terug naar de moersleutelfabriek.
Je hebt een moersleutelfabriek en wilt de gemiddelde lengte van de moersleutels meten om te controleren of ze aan de specificaties voldoen. Je fabriek produceert elke dag duizenden moersleutels, maar het is niet haalbaar om de lengte van elke sleutel te meten. Wel heb je een representatieve steekproef van 100 moersleutels. Laten we jackknife-schatting gebruiken om het gemiddelde te bepalen.
Bekijk de variabele wrench_lengths in de shell.
Deze oefening maakt deel uit van de cursus
Statisticale simulatie in Python
Oefeninstructies
- Maak een jackknife-steekproef door iteratief één observatie uit
wrench_lengthsweg te laten en het resultaat toe te wijzen aanjk_sample. - Bereken het gemiddelde van
jk_sampleen voeg dit toe aanmean_lengths. - Bereken tot slot de jackknife-schatting
mean_lengths_jkals het gemiddelde van de arraymean_lengths.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Leave one observation out from wrench_lengths to get the jackknife sample and store the mean length
mean_lengths, n = [], len(wrench_lengths)
index = np.arange(n)
for i in range(n):
jk_sample = ____[index != i]
mean_lengths.append(____)
# The jackknife estimate is the mean of the mean lengths from each sample
mean_lengths_jk = ____(np.array(mean_lengths))
print("Jackknife estimate of the mean = {}".format(mean_lengths_jk))