Analisando preferências dos usuários
Para entender o impacto real do bug, é essencial determinar quantos assinantes esperaríamos caso não tivesse havido o erro de idioma. Isso é crucial para dimensionar o problema e entender a importância de prevenir esse tipo de erro no futuro.
Nesta etapa, você vai criar um novo DataFrame no qual poderá fazer cálculos para estimar o número esperado de assinantes. Esse DataFrame vai incluir quantos usuários preferem cada idioma por dia. Com o DataFrame em mãos, você pode começar a calcular quantos assinantes você esperaria ter caso o bug de idioma não tivesse ocorrido.
Este exercício faz parte do curso
Análise de campanhas de marketing com pandas
Instruções do exercício
- Agrupe
house_adspordate_servedelanguage_preferred. - Use um dicionário em uma chamada a
.agg()para calcular o número de usuários únicos e somar o número de usuários convertidos. - Faça unstack de
convertedemlevel = 1
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Group house_ads by date and language
converted = house_ads.groupby(____)\
.agg({'____':'____',
'____':'____'})
# Unstack converted
converted_df = pd.DataFrame(____.____(____))