Tamanho de amostra para médias
Ao planejar um teste A/B, você, como Data Scientist, é responsável por verificar primeiro se o teste é viável. Isso inclui responder a perguntas como: temos tráfego suficiente? Como quantificar “suficiente”? Qual é a menor diferença que conseguimos detectar com o tamanho de amostra disponível? Por quanto tempo o experimento precisa rodar? E outras.
Neste exercício, você vai calcular o tamanho mínimo de amostra necessário para capturar uma diferença estatisticamente significativa de um certo valor entre a média de referência order_value do grupo de controle e um novo design a ser testado. As bibliotecas pandas, numpy, matplotlib, seaborn e o DataFrame checkout já estão importados e carregados para você, assim como power de statsmodels.stats.
Este exercício faz parte do curso
A/B Testing em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate and print the baseline mean and standard deviation
mean_B = ____
print(mean_B)
std_B = ____
print(std_B)