Décomposer les règles d’un arbre de décision

Dans cet exercice, vous allez extraire les règles if-else de l’arbre de décision et les tracer pour identifier les principaux moteurs du churn.

L’instance d’arbre de décision entraînée est chargée sous le nom mytree et les variables normalisées sont chargées dans un DataFrame pandas appelé train_X. Le module tree de la bibliothèque sklearn et la bibliothèque graphviz ont déjà été importés pour vous.

Notez que nous avons utilisé une fonction propriétaire display_image() au lieu de display(graph) pour vous faciliter la visualisation du résultat.

Cet exercice fait partie du cours

<cours>Machine Learning pour le marketing en Python</cours>

Voir le cours

Instructions de l’exercice

Exportez l’objet graphviz à partir de l’arbre de décision entraîné.
Assignez les noms de variables (feature names).
Réglez la précision sur 1 et ajoutez les noms de classes.
Appelez la fonction Source() de graphviz et passez-lui l’objet graphviz exporté.

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Export graphviz object from the trained decision tree 
exported = tree.___(decision_tree=mytree, 
			# Assign feature names
            out_file=None, ___=train_X.columns, 
			# Set precision to 1 and add class names
			precision=1, ___=['Not churn','Churn'], filled = True)

# Call the Source function and pass the exported graphviz object
graph = graphviz.___(exported)

# Display the decision tree
display_image("/usr/local/share/datasets/decision_tree_rules.png")

Modifier et exécuter le code