Ajuster un arbre de décision
Vous allez maintenant tenter de construire un modèle d’arbre de décision. Un arbre de décision est une liste de règles if-else apprises automatiquement qui décident, dans le cas du churn télécom, si les clients vont résilier ou non. Voici un exemple de graphe d’arbre de décision construit sur le célèbre jeu de données de survie du Titanic.

Les train_X, test_X, train_Y, test_Y de l’exercice précédent ont été chargés pour vous. Le module tree et la fonction accuracy_score ont également été importés depuis la bibliothèque sklearn. Vous allez maintenant construire votre modèle et évaluer ses performances sur des données jamais vues.
Cet exercice fait partie du cours
Machine Learning pour le marketing en Python
Instructions
- Initialisez le modèle d’arbre de décision avec
max_depthfixé à 5. - Ajustez le modèle sur les données d’entraînement, d’abord
train_X, puistrain_Y. - Prédisez les valeurs sur les données de test, ici
test_X. - Mesurez les performances de votre modèle sur les données de test en comparant les étiquettes réelles de test avec les prédictions.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Initialize the model with max_depth set at 5
mytree = tree.___(max_depth = ___)
# Fit the model on the training data
treemodel = mytree.___(___, ___)
# Predict values on the testing data
pred_Y = treemodel.___(___)
# Measure model performance on testing data
accuracy_score(___, ___)