Comparando taxas de conversão
Agora que sabemos que a alocação está relativamente equilibrada, vamos analisar a taxa de conversão do controle e da personalização. Como escolhemos a taxa de conversão como nossa métrica principal neste teste, é muito importante avaliar se a conversão foi maior no tratamento de personalização em comparação ao controle. Embora vamos nos aprofundar nos próximos exercícios, medir a diferença entre a métrica principal no controle e no tratamento é a parte mais importante para avaliar o sucesso de um teste A/B.
O DataFrame email já foi carregado no seu workspace e contém apenas as linhas do DataFrame marketing em que marketing_channel é 'Email'.
Este exercício faz parte do curso
Análise de campanhas de marketing com pandas
Instruções do exercício
- Agrupe o DataFrame
emailporuser_idevariant, selecione o valor máximo da colunaconvertede armazene o resultado emsubscribers. - Remova valores ausentes da coluna
controldesubscribers_df. - Remova valores ausentes da coluna
personalizationdesubscribers_df. - Calcule a taxa de conversão para
personalizationecontrolusando a função apropriada para cada um.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Group marketing by user_id and variant
subscribers = email.____(['user_id',
____])____
subscribers_df = pd.DataFrame(subscribers.unstack(level=1))
# Drop missing values from the control column
control = ____
# Drop missing values from the personalization column
personalization = ____
print('Control conversion rate:', ____)
print('Personalization conversion rate:', ____)