ROC-curves en AUC berekenen
De vorige oefeningen hebben laten zien dat nauwkeurigheid een zeer misleidende maat is voor modelprestatie op onevenwichtige gegevenssets. Het in een grafiek weergeven van de modelprestatie laat de afweging beter zien tussen een model dat te agressief is en een model dat te terughoudend is.
In deze oefening maak je een ROC-curve en bereken je de oppervlakte onder de curve (AUC) om het logistic regression-model voor donaties te evalueren dat je eerder hebt gebouwd.
De gegevensset donors met de kolom met voorspelde kansen, donation_prob, is voor je geladen.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Classificatie
Oefeninstructies
- Laad het pakket
pROC. - Maak een ROC-curve met
roc()en de kolommen met werkelijke en voorspelde donaties. Sla het resultaat op alsROC. - Gebruik
plot()om hetROC-object te tekenen. Specifieercol = "blue"om de curve blauw te kleuren. - Bereken de oppervlakte onder de curve met
auc().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Load the pROC package
# Create a ROC curve
ROC <- roc(___, ___)
# Plot the ROC curve
plot(___, col = ___)
# Calculate the area under the curve (AUC)
auc(___)