Prever churn com árvore de decisão

Agora você vai aproveitar as habilidades do exercício anterior e construir uma árvore de decisão mais complexa, com parâmetros adicionais, para prever o churn de clientes. Você vai se aprofundar no problema de previsão de churn no próximo capítulo. Aqui, você vai executar novamente o classificador de árvore de decisão nos seus dados de treino, prever a taxa de churn em dados não vistos (teste) e avaliar a acurácia do modelo em ambos os conjuntos de dados.

O módulo tree da biblioteca sklearn já foi carregado para você, assim como a função accuracy_score de sklearn.metrics. As variáveis de atributos e alvo também foram importadas como train_X, train_Y para os dados de treino, e test_X, test_Y para os dados de teste.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

Inicialize uma árvore de decisão com profundidade máxima igual a 7 e usando o critério gini.
Faça o ajuste (fit) do modelo aos dados de treino.
Faça as previsões no conjunto de teste.
Imprima os valores de acurácia para os conjuntos de treino e teste.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___, 
               criterion = 'gini', 
               splitter  = 'best')

# Fit the model to the training data
clf = clf.___(train_X, train_Y)

# Predict the values on test dataset
pred_Y = clf.___(test_X)

# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3)) 
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))

Editar e executar o código