Plotando a distribuição das diferenças
Agora vamos plotar a distribuição das diferenças dos nossos resultados, ou seja, a distribuição do nosso lift.
As variáveis cont_var e test_var, assim como cont_conv e test_conv, já foram carregadas para você. Além disso, os limites inferior e superior do intervalo de confiança dessa distribuição foram fornecidos como lwr_ci e upr_ci, respectivamente.
Este exercício faz parte do curso
Customer Analytics and A/B Testing in Python
Instruções do exercício
- Calcule a média da distribuição do lift subtraindo a taxa de conversão do grupo de controle (
cont_conv) da taxa de conversão do grupo de teste (test_conv). - Gere o intervalo de valores de x para a distribuição das diferenças, cobrindo 3 desvios-padrão de largura.
- Plote uma distribuição normal especificando os valores calculados de
lift_meanelift_sd. - Plote uma linha vertical verde na média da distribuição e linhas verticais vermelhas nos limites inferior e superior do intervalo de confiança. Isso já foi feito para você, então clique em 'Enviar Resposta' para ver o resultado!
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Find the lift mean and standard deviation
lift_mean = ____
lift_sd = (test_var + cont_var) ** 0.5
# Generate the range of x-values
lift_line = np.linspace(lift_mean - 3 * _____, lift_mean + 3 * _____, 100)
# Plot the lift distribution
plt.plot(lift_line, norm.pdf(lift_line, _____, _____))
# Add the annotation lines
plt.axvline(x = lift_mean, color = 'green')
plt.axvline(x = lwr_ci, color = 'red')
plt.axvline(x = upr_ci, color = 'red')
plt.show()