Aan de slagGa gratis aan de slag

T-test voor verschil in gemiddelden

Je bent Data Scientist bij een e-commercebedrijf en helpt het betalingensteam de checkoutpagina te kiezen die leidt tot een hogere bestelwaarde en snellere aankoopbeslissingen.

Na het schatten van de vereiste steekproefgrootte en het uitvoeren van alle sanity checks, ga je de verschillen in de gemiddelde order_value en time_on_page tussen checkout_page-varianten analyseren om te bepalen welk ontwerp het beste presteert.

De DataFrame checkout is beschikbaar, en pingouin, pandas en numpy zijn voor je ingeladen.

NaN-waarden in order_value kunnen duiden op gebruikers die geen aankoop hebben afgerond. Je analyseert de gemiddelde bestelwaarde alleen voor voltooide bestellingen (complete data).

Deze oefening maakt deel uit van de cursus

A/B-testen in Python

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Calculate the mean order values and run a t-test between variants A and B
print(checkout.____('checkout_page')['____'].____())

ttest = ____.____(x=checkout[checkout['checkout_page']=='____']['____'], 
                       y=checkout[checkout['checkout_page']=='____']['____'],
                       paired=____,
                       alternative="____")
print(ttest)
Code bewerken en uitvoeren