Teste t para diferença de médias
Você é Cientista de Dados em uma empresa de e-commerce e precisa ajudar o time de pagamentos a escolher o design da página de checkout que gera maior valor de pedido e decisões de compra mais rápidas.
Depois de estimar o tamanho de amostra necessário e passar em todas as verificações de sanidade, você vai analisar as diferenças na média de order_value e time_on_page entre as variantes de checkout_page para decidir qual design tem melhor desempenho.
O DataFrame checkout está disponível, e pingouin, pandas e numpy já foram carregados para você.
Valores NaN em order_value podem indicar usuários que não concluíram a compra. Você vai analisar o valor médio do pedido apenas entre pedidos concluídos (dados completos).
Este exercício faz parte do curso
A/B Testing em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Calculate the mean order values and run a t-test between variants A and B
print(checkout.____('checkout_page')['____'].____())
ttest = ____.____(x=checkout[checkout['checkout_page']=='____']['____'],
y=checkout[checkout['checkout_page']=='____']['____'],
paired=____,
alternative="____")
print(ttest)