ComeçarComece de graça

Prever churn com árvore de decisão

Agora você vai aproveitar as habilidades do exercício anterior e construir uma árvore de decisão mais complexa, com parâmetros adicionais, para prever o churn de clientes. Você vai se aprofundar no problema de previsão de churn no próximo capítulo. Aqui, você vai executar novamente o classificador de árvore de decisão nos seus dados de treino, prever a taxa de churn em dados não vistos (teste) e avaliar a acurácia do modelo em ambos os conjuntos de dados.

O módulo tree da biblioteca sklearn já foi carregado para você, assim como a função accuracy_score de sklearn.metrics. As variáveis de atributos e alvo também foram importadas como train_X, train_Y para os dados de treino, e test_X, test_Y para os dados de teste.

Este exercício faz parte do curso

Machine Learning para Marketing em Python

Ver curso

Instruções do exercício

  • Inicialize uma árvore de decisão com profundidade máxima igual a 7 e usando o critério gini.
  • Faça o ajuste (fit) do modelo aos dados de treino.
  • Faça as previsões no conjunto de teste.
  • Imprima os valores de acurácia para os conjuntos de treino e teste.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___, 
               criterion = 'gini', 
               splitter  = 'best')

# Fit the model to the training data
clf = clf.___(train_X, train_Y)

# Predict the values on test dataset
pred_Y = clf.___(test_X)

# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3)) 
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))
Editar e executar o código