Aan de slagGa gratis aan de slag

Een analogie met tijd op de website

Het blijkt dat je al een hypothesetoets hebt gedaan die lijkt op een A/B-test waarin je wilt weten hoeveel tijd er op de website wordt doorgebracht vóór en na een advertentiecampagne. De kikker-tongkracht (een continue grootheid, net als tijd op de website) is een analogie. "Voor" = Kikker A en "na" = Kikker B. Laten we dit opnieuw oefenen met iets dat echt een voor/na-situatie is.

We keren terug naar de no-hittergegevensset. In 1920 voerde Major League Baseball belangrijke regelwijzigingen door die een einde maakten aan het zogeheten dead ball-tijdperk. Belangrijk was dat de werper de bal niet langer mocht bespugen of krassen, iets dat werpers sterk bevoordeelde. In dit probleem voer je een A/B-test uit om te bepalen of deze regelwijzigingen hebben geleid tot een lagere frequentie van no-hitters (dus een langere gemiddelde tijd tussen no-hitters), waarbij je het verschil in gemiddelde inter-no-hittertijd als teststatistiek gebruikt. De inter-no-hittertijden voor de respectievelijke tijdperken staan in de arrays nht_dead en nht_live, waarbij "nht" staat voor "no-hitter time".

Omdat je in deze oefening je functie draw_perm_reps() gebruikt, is het handig om jezelf nog even te herinneren aan de aanroep: draw_perm_reps(d1, d2, func, size=1) of zelfs terug te kijken naar de oefening uit hoofdstuk 3 waarin je deze hebt gedefinieerd.

Deze oefening maakt deel uit van de cursus

Statistical Thinking in Python (deel 2)

Cursus bekijken

Oefeninstructies

  • Bereken het geobserveerde verschil in gemiddelde inter-nohittertijd met diff_of_means().
  • Genereer 10.000 permutatiereplicaties van het verschil van gemiddelden met draw_perm_reps().
  • Bereken en print de p-waarde.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Compute the observed difference in mean inter-no-hitter times: nht_diff_obs
nht_diff_obs = ____

# Acquire 10,000 permutation replicates of difference in mean no-hitter time: perm_replicates
perm_replicates = ____


# Compute and print the p-value: p
p = ____
print('p-val =', p)
Code bewerken en uitvoeren