Steekproefgrootte voor gemiddelden
Als je een A/B-test ontwerpt, ben jij als Data Scientist verantwoordelijk om eerst te controleren of een test überhaupt haalbaar is. Dat betekent dat je vragen beantwoordt zoals: hebben we genoeg verkeer? Hoe definiëren we "genoeg"? Wat is het minimale verschil dat we kunnen detecteren met de steekproefgrootte die we hebben? Hoe lang moet een experiment lopen? En meer.
In deze oefening bereken je de minimale steekproefgrootte die nodig is om een statistisch significant verschil van een bepaalde waarde te detecteren tussen het basisgemiddelde order_value voor de controlegroep en een nieuw ontwerp dat getest wordt. De libraries pandas, numpy, matplotlib, seaborn en de checkout-DataFrame zijn al voor je geïmporteerd en ingeladen, evenals power uit statsmodels.stats.
Deze oefening maakt deel uit van de cursus
A/B-testen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate and print the baseline mean and standard deviation
mean_B = ____
print(mean_B)
std_B = ____
print(std_B)