Tamaño de muestra para medias
Al diseñar un test A/B, como Data Scientist eres responsable de comprobar primero si el experimento es viable. Esto implica contestar varias preguntas como: ¿tenemos suficiente tráfico? ¿Cómo cuantificamos “suficiente”? ¿Cuál es la diferencia mínima que podemos detectar dado el tamaño de muestra disponible? ¿Cuánto tiempo debe ejecutarse el experimento? Y más.
En este ejercicio, calcularás el tamaño mínimo de muestra necesario para detectar una diferencia estadísticamente significativa de un valor concreto entre la media de referencia order_value del grupo de control y un nuevo diseño a probar. Las librerías pandas, numpy, matplotlib, seaborn y el DataFrame checkout ya están importados y cargados para ti, así como power de statsmodels.stats.
Este ejercicio forma parte del curso
A/B Testing en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate and print the baseline mean and standard deviation
mean_B = ____
print(mean_B)
std_B = ____
print(std_B)