Discretização de uma determinada variável
Para criar predictor insight graphs para variáveis contínuas, você primeiro precisa discretizá-las. Em Python, você pode discretizar colunas do pandas usando o método qcut.
Para verificar se a variável foi discretizada de forma adequada, você pode checar se os intervalos têm tamanho igual usando o método groupby:
print(basetable.groupby("discretized_variable").size()
Este exercício faz parte do curso
Introdução à Análise Preditiva em Python
Instruções do exercício
- Use o método
qcutpara discretizar a variáveltime_since_last_donationem 10 grupos. Atribua essa variável a uma nova coluna chamada "bins_recency". - Use o método
groupbypara verificar se os intervalos têm aproximadamente o mesmo tamanho.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)
# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())