ROC-curve
Laten we nu een ROC-curve maken voor onze random forest-classifier. De eerste stap is om de voorspelde waarschijnlijkheden te berekenen die de classifier voor elk label teruggeeft met de methode .predict_proba(). Daarna kun je de functie roc_curve uit sklearn.metrics gebruiken om de false positive rate en true positive rate te berekenen, die je vervolgens met matplotlib kunt plotten.
Een RandomForestClassifier met een trainingsset van 70% is getraind op de data en staat in je workspace als clf.
Deze oefening maakt deel uit van de cursus
Marketinganalyse: klantverloop voorspellen in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Generate the probabilities
y_pred_prob = ____.____(____)[:, 1]