Een analogie met tijd op de website
Het blijkt dat je al een hypothesetoets hebt gedaan die lijkt op een A/B-test waarin je wilt weten hoeveel tijd er op de website wordt doorgebracht vóór en na een advertentiecampagne. De kikker-tongkracht (een continue grootheid, net als tijd op de website) is een analogie. "Voor" = Kikker A en "na" = Kikker B. Laten we dit opnieuw oefenen met iets dat echt een voor/na-situatie is.
We keren terug naar de no-hittergegevensset. In 1920 voerde Major League Baseball belangrijke regelwijzigingen door die een einde maakten aan het zogeheten dead ball-tijdperk. Belangrijk was dat de werper de bal niet langer mocht bespugen of krassen, iets dat werpers sterk bevoordeelde. In dit probleem voer je een A/B-test uit om te bepalen of deze regelwijzigingen hebben geleid tot een lagere frequentie van no-hitters (dus een langere gemiddelde tijd tussen no-hitters), waarbij je het verschil in gemiddelde inter-no-hittertijd als teststatistiek gebruikt. De inter-no-hittertijden voor de respectievelijke tijdperken staan in de arrays nht_dead en nht_live, waarbij "nht" staat voor "no-hitter time".
Omdat je in deze oefening je functie draw_perm_reps() gebruikt, is het handig om jezelf nog even te herinneren aan de aanroep: draw_perm_reps(d1, d2, func, size=1) of zelfs terug te kijken naar de oefening uit hoofdstuk 3 waarin je deze hebt gedefinieerd.
Deze oefening maakt deel uit van de cursus
Statistical Thinking in Python (deel 2)
Oefeninstructies
- Bereken het geobserveerde verschil in gemiddelde inter-nohittertijd met
diff_of_means(). - Genereer 10.000 permutatiereplicaties van het verschil van gemiddelden met
draw_perm_reps(). - Bereken en print de p-waarde.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute the observed difference in mean inter-no-hitter times: nht_diff_obs
nht_diff_obs = ____
# Acquire 10,000 permutation replicates of difference in mean no-hitter time: perm_replicates
perm_replicates = ____
# Compute and print the p-value: p
p = ____
print('p-val =', p)