De Precision-Recall-curve plotten
Je kunt ook een Precision-Recall-curve plotten om de trade-off tussen die twee in je model te onderzoeken. In deze curve zijn Precision en Recall omgekeerd evenredig; als Precision toeneemt, daalt Recall en omgekeerd. Je model moet een goede balans vinden, anders krijg je ofwel veel false positives, of vang je te weinig echte fraudegevallen. Om dit te bereiken en prestaties te vergelijken, zijn precision-recall-curves erg handig.
Je Random Forest Classifier is beschikbaar als model, en de voorspellingen als predicted. Je kunt de average precision-score en de PR-curve rechtstreeks uit het sklearn-pakket halen. De functie plot_pr_curve() plot de resultaten voor je. Laten we het proberen.
Deze oefening maakt deel uit van de cursus
Fraudedetectie in Python
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Calculate average precision and the PR curve
average_precision = ____(____, ____)