Décomposer les règles d’un arbre de décision
Dans cet exercice, vous allez extraire les règles if-else de l’arbre de décision et les tracer pour identifier les principaux moteurs du churn.
L’instance d’arbre de décision entraînée est chargée sous le nom mytree et les variables normalisées sont chargées dans un DataFrame pandas appelé train_X. Le module tree de la bibliothèque sklearn et la bibliothèque graphviz ont déjà été importés pour vous.
Notez que nous avons utilisé une fonction propriétaire display_image() au lieu de display(graph) pour vous faciliter la visualisation du résultat.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Exportez l’objet
graphvizà partir de l’arbre de décision entraîné. - Assignez les noms de variables (feature names).
- Réglez la précision sur 1 et ajoutez les noms de classes.
- Appelez la fonction
Source()degraphvizet passez-lui l’objetgraphvizexporté.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Export graphviz object from the trained decision tree
exported = tree.___(decision_tree=mytree,
# Assign feature names
out_file=None, ___=train_X.columns,
# Set precision to 1 and add class names
precision=1, ___=['Not churn','Churn'], filled = True)
# Call the Source function and pass the exported graphviz object
graph = graphviz.___(exported)
# Display the decision tree
display_image("/usr/local/share/datasets/decision_tree_rules.png")