Tamaño de muestra para proporciones
Los conjuntos de datos reales pueden estar desordenados. Como Analytics Engineer que trabaja con datos en el mundo real, te encontrarás con situaciones en las que la varianza en los datos es demasiado alta como para capturar una diferencia significativa en las métricas. Este problema es más probable con métricas continuas como el valor medio del pedido del ejercicio anterior. Hay varias formas de abordarlo, pero una de las soluciones es encontrar una métrica con menor varianza que siga alineada con los objetivos del negocio.
Aquí vas a calcular el tamaño de la muestra para una métrica binaria: la tasa de registro (signup rate), que indica si un usuario se registró o no en el servicio, en lugar del precio pagado, que puede variar más entre usuarios. El DataFrame homepage y las librerías pandas, numpy ya están cargados para ti, así como proportion_effectsize de statsmodels.stats.proportion y power de statsmodels.stats.
Este ejercicio forma parte del curso
A/B Testing en Python
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Calculate the baseline signup rate for group A
p_A = ____
print('Group A mean signup rate:', ____)