Paarsgewijze t-toetsen
Handmatig losse vergelijkingen uitvoeren met individuele t-toetsen wordt al snel onhandig naarmate het aantal groepen toeneemt. Gelukkig maakt de .pairwise_tests()-methode van het pingouin-pakket dit een stuk eenvoudiger.
Je gaat de verschillen in de gemiddelde time-on-page-metric verkennen tussen vier verschillende varianten van een landingspagina die in de DataFrame homepage staan.
De gegevensset homepage is beschikbaar en bevat de kolommen signup en time_on_page. Elke rij in de DataFrame komt overeen met een unieke gebruiker die de betreffende landing_page bezoekt. De kolom signup bevat binaire gegevens: ‘1’ betekent dat de gebruiker zich heeft aangemeld en ‘0’ betekent dat de gebruiker de pagina heeft verlaten. De kolom time_on_page geeft de tijd (in seconden) weer die elke gebruiker op de landingspagina heeft doorgebracht voordat hij ofwel afhaakte of zich aanmeldde. pingouin is geladen, samen met pandas en numpy.
Deze oefening maakt deel uit van de cursus
A/B-testen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Perform a pairwise t-test on signup, grouped by landing-page
pairwise = pingouin.pairwise_tests(data=homepage,
dv="____",
between="____",
padjust="____")
print(pairwise)