Courbe ROC
Créons maintenant une courbe ROC pour notre classifieur random forest. La première étape consiste à calculer les probabilités prédites retournées par le classifieur pour chaque étiquette à l’aide de sa méthode .predict_proba(). Ensuite, vous pouvez utiliser la fonction roc_curve de sklearn.metrics pour calculer le taux de faux positifs et le taux de vrais positifs, que vous pourrez tracer avec matplotlib.
Un RandomForestClassifier entraîné sur 70 % des données a été ajusté et est disponible dans votre environnement sous le nom clf.
Cet exercice fait partie du cours
Marketing Analytics : prédire l’attrition client en Python
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Generate the probabilities
y_pred_prob = ____.____(____)[:, 1]