ComeçarComece de graça

Limpeza de dados de teste A/B

A limpeza de dados em testes A/B não é diferente do processo padrão ensinado em cursos de limpeza e manipulação de dados. Porém, entender o contexto e o comportamento de logging de cada teste A/B, caso a caso, permite que você decida como lidar com dados bagunçados. Remover ou manter duplicatas e valores ausentes são dois pontos em que precisamos ter cuidado com a definição das métricas e com a consistência delas entre as variantes.

Os DataFrames AdSmart e homepage, assim como as bibliotecas pandas e numpy, já estão carregados para você.

A fonte do conjunto de dados Adsmart no Kaggle está linkada aqui.

Este exercício faz parte do curso

A/B Testing em Python

Ver curso

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Check for duplicate rows due to logging issues 
print(____(AdSmart))
print(____(AdSmart.____(keep='____')))
Editar e executar o código