Comece agoraComece grátis

Tamanho de amostra para proporções

Conjuntos de dados reais podem ser desorganizados. Como Analytics Engineer trabalhando com dados do mundo real, você vai se deparar com situações em que a variância é alta demais para captar uma diferença significativa nos seus métricos. Esse problema é mais comum com métricas contínuas, como o valor médio do pedido no exercício anterior. Há várias maneiras de lidar com isso, e uma delas é encontrar uma métrica com menor variância que ainda esteja alinhada aos objetivos de negócio.

Aqui, você vai calcular o tamanho de amostra para uma métrica binária: a taxa de cadastro (signup), que indica se um usuário se cadastrou no serviço ou não, em vez do preço pago, que pode variar mais entre usuários. O DataFrame homepage e as bibliotecas pandas, numpy já estão carregados para você, assim como proportion_effectsize de statsmodels.stats.proportion e power de statsmodels.stats.

Este exercicio faz parte do curso

A/B Testing em Python

Ver curso

exercicio interativo prático

Tente este exercicio completando este código de exemplo.

# Calculate the baseline signup rate for group A
p_A = ____
print('Group A mean signup rate:', ____)
Editar e Executar Código