Predecir churn con árbol de decisión
Ahora vas a aprovechar lo que hiciste en el ejercicio anterior y crear un árbol de decisión más complejo, con parámetros adicionales, para predecir el churn de clientes. En el próximo capítulo profundizarás en el problema de predicción de churn. Aquí volverás a ejecutar el clasificador de árbol de decisión sobre tus datos de entrenamiento, predecirás el churn en datos no vistos (test) y evaluarás la exactitud del modelo en ambos conjuntos.
El módulo tree de la biblioteca sklearn ya está cargado, al igual que la función accuracy_score de sklearn.metrics. Las variables de características y objetivo también se han importado como train_X, train_Y para entrenamiento, y test_X, test_Y para test.
Este ejercicio forma parte del curso
Machine Learning para marketing en Python
Instrucciones del ejercicio
- Inicializa un árbol de decisión con una profundidad máxima de 7 y usando el criterio gini.
- Ajusta el modelo a los datos de entrenamiento.
- Predice los valores en el conjunto de test.
- Imprime los valores de exactitud para los conjuntos de entrenamiento y test.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Initialize the Decision Tree
clf = tree.DecisionTreeClassifier(max_depth = ___,
criterion = 'gini',
splitter = 'best')
# Fit the model to the training data
clf = clf.___(train_X, train_Y)
# Predict the values on test dataset
pred_Y = clf.___(test_X)
# Print accuracy values
print("Training accuracy: ", np.round(clf.score(train_X, train_Y), 3))
print("Test accuracy: ", np.round(___(test_Y, pred_Y), 3))