Een z-score berekenen
Omdat variabelen willekeurige bereiken en eenheden hebben, moeten we ze standaardiseren. Een hypothesetoets die andere antwoorden geeft als de variabelen in euro’s in plaats van Amerikaanse dollars staan, is bijvoorbeeld weinig waard. Standaardisatie voorkomt dat.
Een gestandaardiseerde waarde die in een hypothesetoets van belang is, heet een z-score. Om die te berekenen, heb je drie getallen nodig: de steekproefstatistiek (puntenschatting), de veronderstelde waarde, en de standaardfout van de statistiek (geschat op basis van de bootstrapverdeling).
De steekproefstatistiek is beschikbaar als late_prop_samp.
late_shipments_boot_distn is een bootstrapverdeling van het aandeel te late zendingen, beschikbaar als een lijst.
pandas en numpy zijn geladen met hun gebruikelijke aliassen.
Deze oefening maakt deel uit van de cursus
Hypothesetoetsen in Python
Oefeninstructies
- Veronderstel dat het aandeel te late zendingen 6% is.
- Bereken de standaardfout op basis van de standaardafwijking van de bootstrapverdeling.
- Bereken de z-score.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Hypothesize that the proportion is 6%
late_prop_hyp = ____
# Calculate the standard error
std_error = ____
# Find z-score of late_prop_samp
z_score = ____
# Print z_score
print(z_score)