Predecir churn con árbol de decisión

Ahora vas a aprovechar lo que hiciste en el ejercicio anterior y crear un árbol de decisión más complejo, con parámetros adicionales, para predecir el churn de clientes. En el próximo capítulo profundizarás en el problema de predicción de churn. Aquí volverás a ejecutar el clasificador de árbol de decisión sobre tus datos de entrenamiento, predecirás el churn en datos no vistos (test) y evaluarás la exactitud del modelo en ambos conjuntos.

El módulo tree de la biblioteca sklearn ya está cargado, al igual que la función accuracy_score de sklearn.metrics. Las variables de características y objetivo también se han importado como train_X, train_Y para entrenamiento, y test_X, test_Y para test.

Este ejercicio forma parte del curso

Machine Learning para marketing en Python

Ver curso

Instrucciones del ejercicio

Inicializa un árbol de decisión con una profundidad máxima de 7 y usando el criterio gini.
Ajusta el modelo a los datos de entrenamiento.
Predice los valores en el conjunto de test.
Imprime los valores de exactitud para los conjuntos de entrenamiento y test.

ejercicio interactivo práctico

Prueba este ejercicio completando este código de ejemplo.

# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___, 
               criterion = 'gini', 
               splitter  = 'best')

# Fit the model to the training data
clf = clf.___(train_X, train_Y)

# Predict the values on test dataset
pred_Y = clf.___(test_X)

# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3)) 
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))

Editar y ejecutar código