ComeçarComece de graça

Discretização de uma determinada variável

Para criar predictor insight graphs para variáveis contínuas, você primeiro precisa discretizá-las. Em Python, você pode discretizar colunas do pandas usando o método qcut.

Para verificar se a variável foi discretizada de forma adequada, você pode checar se os intervalos têm tamanho igual usando o método groupby:

print(basetable.groupby("discretized_variable").size()

Este exercício faz parte do curso

Introdução à Análise Preditiva em Python

Ver curso

Instruções do exercício

  • Use o método qcut para discretizar a variável time_since_last_donation em 10 grupos. Atribua essa variável a uma nova coluna chamada "bins_recency".
  • Use o método groupby para verificar se os intervalos têm aproximadamente o mesmo tamanho.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Discretize the variable time_since_last_donation in 10 bins
basetable["bins_recency"] = pd.qcut(____,____)

# Print the group sizes of the discretized variable
print(basetable.groupby("____").size())
Editar e executar o código