Prever churn com árvore de decisão
Agora você vai aproveitar as habilidades do exercício anterior e construir uma árvore de decisão mais complexa, com parâmetros adicionais, para prever o churn de clientes. Você vai se aprofundar no problema de previsão de churn no próximo capítulo. Aqui, você vai executar novamente o classificador de árvore de decisão nos seus dados de treino, prever a taxa de churn em dados não vistos (teste) e avaliar a acurácia do modelo em ambos os conjuntos de dados.
O módulo tree da biblioteca sklearn já foi carregado para você, assim como a função accuracy_score de sklearn.metrics. As variáveis de atributos e alvo também foram importadas como train_X, train_Y para os dados de treino, e test_X, test_Y para os dados de teste.
Este exercício faz parte do curso
Machine Learning para Marketing em Python
Instruções do exercício
- Inicialize uma árvore de decisão com profundidade máxima igual a 7 e usando o critério gini.
- Faça o ajuste (fit) do modelo aos dados de treino.
- Faça as previsões no conjunto de teste.
- Imprima os valores de acurácia para os conjuntos de treino e teste.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___,
criterion = 'gini',
splitter = 'best')
# Fit the model to the training data
clf = clf.___(train_X, train_Y)
# Predict the values on test dataset
pred_Y = clf.___(test_X)
# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3))
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))