Limpeza de dados de teste A/B
A limpeza de dados em testes A/B não é diferente do processo padrão ensinado em cursos de limpeza e manipulação de dados. Porém, entender o contexto e o comportamento de logging de cada teste A/B, caso a caso, permite que você decida como lidar com dados bagunçados. Remover ou manter duplicatas e valores ausentes são dois pontos em que precisamos ter cuidado com a definição das métricas e com a consistência delas entre as variantes.
Os DataFrames AdSmart e homepage, assim como as bibliotecas pandas e numpy, já estão carregados para você.
A fonte do conjunto de dados Adsmart no Kaggle está linkada aqui.
Este exercício faz parte do curso
A/B Testing em Python
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Check for duplicate rows due to logging issues
print(____(AdSmart))
print(____(AdSmart.____(keep='____')))