Tamanho de amostra para proporções
Conjuntos de dados reais podem ser desorganizados. Como Analytics Engineer trabalhando com dados do mundo real, você vai se deparar com situações em que a variância é alta demais para captar uma diferença significativa nos seus métricos. Esse problema é mais comum com métricas contínuas, como o valor médio do pedido no exercício anterior. Há várias maneiras de lidar com isso, e uma delas é encontrar uma métrica com menor variância que ainda esteja alinhada aos objetivos de negócio.
Aqui, você vai calcular o tamanho de amostra para uma métrica binária: a taxa de cadastro (signup), que indica se um usuário se cadastrou no serviço ou não, em vez do preço pago, que pode variar mais entre usuários. O DataFrame homepage e as bibliotecas pandas, numpy já estão carregados para você, assim como proportion_effectsize de statsmodels.stats.proportion e power de statsmodels.stats.
Este exercício faz parte do curso
A/B Testing em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the baseline signup rate for group A
p_A = ____
print('Group A mean signup rate:', ____)