ROC-Kurve zeichnen
Wie du im Video gesehen hast, ist eine ROC-Kurve eine sehr praktische Abkürzung, um die Leistung eines Klassifikators über alle möglichen Schwellenwerte zusammenzufassen. Das erspart dir viel mühsame Arbeit, bei der du für viele verschiedene Schwellen Werte vorhersagen und jeweils die Konfusionsmatrix betrachten müsstest.
Mein Lieblingspaket zum Berechnen von ROC-Kurven ist caTools, das eine Funktion namens colAUC() enthält. Diese Funktion ist sehr benutzerfreundlich und kann tatsächlich ROC-Kurven für mehrere Prädiktoren gleichzeitig berechnen. In diesem Fall musst du die ROC-Kurve nur für einen Prädiktor berechnen, z. B.:
colAUC(predicted_probabilities, actual, plotROC = TRUE)
Die Funktion gibt einen Wert namens AUC zurück (dazu später mehr), und mit dem Argument plotROC = TRUE erhältst du zusätzlich die Grafik der ROC-Kurve zur visuellen Prüfung.
Diese Übung ist Teil des Kurses
Maschinelles Lernen mit caret in R
Anleitung zur Übung
model, test und train aus der letzten Übung mit den Sonar-Daten sind in deinem Workspace geladen.
- Sage Wahrscheinlichkeiten voraus (d. h.
type = "response") auf dem Testset und speichere das Ergebnis alsp. - Erstelle eine ROC-Kurve mithilfe der vorhergesagten Wahrscheinlichkeiten des Testsets.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Predict on test: p
# Make ROC curve