ComeçarComece de graça

Tamanho de amostra para proporções

Conjuntos de dados reais podem ser desorganizados. Como Analytics Engineer trabalhando com dados do mundo real, você vai se deparar com situações em que a variância é alta demais para captar uma diferença significativa nos seus métricos. Esse problema é mais comum com métricas contínuas, como o valor médio do pedido no exercício anterior. Há várias maneiras de lidar com isso, e uma delas é encontrar uma métrica com menor variância que ainda esteja alinhada aos objetivos de negócio.

Aqui, você vai calcular o tamanho de amostra para uma métrica binária: a taxa de cadastro (signup), que indica se um usuário se cadastrou no serviço ou não, em vez do preço pago, que pode variar mais entre usuários. O DataFrame homepage e as bibliotecas pandas, numpy já estão carregados para você, assim como proportion_effectsize de statsmodels.stats.proportion e power de statsmodels.stats.

Este exercício faz parte do curso

A/B Testing em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Calculate the baseline signup rate for group A
p_A = ____
print('Group A mean signup rate:', ____)
Editar e executar o código