Calcular um target agregado
Suponha que você quer construir um modelo preditivo para identificar quais doadores têm mais chance de doar mais de 50 euros em um determinado mês.
Você tem um basetable basetable que já possui uma linha para cada doador na população; a coluna donor_id representa o doador. A linha do tempo indica que o target deve ser 1 se o doador tiver doado mais de 50 euros em janeiro de 2017 e 0 caso contrário.
O dataframe do pandas gifts_201701 contém todas as doações de janeiro de 2017. Neste exercício, você vai adicionar a coluna de target ao basetable.
Este exercício faz parte do curso
Análise Preditiva Intermediária em Python
Instruções do exercício
- Construa
gifts_summed, que tenha, para cada doador emgifts_201701, a soma das doações. - A partir de
gifts_summed, derive uma listatargetscom os doadores que doaram mais de 50 euros no período de target. - Adicione o target ao basetable.
- Calcule e imprima a incidência do target.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Sum of donations for each donor in gifts_201701
gifts_summed = ____.groupby("____")["____"].____().reset_index()
# List with targets
targets = list(gifts_summed["id"][____["____"] > ____])
# Add targets to the basetable
basetable["target"] = pd.Series([____ if donor_id in targets else ____ for donor_id in basetable["donor_id"]])
# Calculate and print the target incidence
print(round(____["____"].____() / ____(____), 2))