Den Evaluator erstellen
Wenn du eine Kreuzvalidierung für die Modellauswahl durchführst, brauchst du zuerst eine Möglichkeit, verschiedene Modelle zu vergleichen. Zum Glück hat das Untermodul pyspark.ml.evaluation
Klassen für die Auswertung verschiedener Modelle. Da es sich bei deinem Modell um ein binäres Klassifizierungsmodell handelt, verwendest du den BinaryClassificationEvaluator
aus dem Modul pyspark.ml.evaluation
.
Dieser Evaluator berechnet die Fläche unter ROC. Dies ist ein Maß, das die beiden Arten von Fehlern, die ein binärer Klassifikator machen kann (falsch-positiv und falsch-negativ), in einer einzigen Zahl zusammenfasst. Am Ende dieses Kapitels erfährst du mehr darüber!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Importiere das Untermodul
pyspark.ml.evaluation
alsevals
. - Erstelle
evaluator
, indem duevals.BinaryClassificationEvaluator()
mit dem ArgumentmetricName="areaUnderROC"
aufrufst.
Interaktive Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Import the evaluation submodule
import ____ as evals
# Create a BinaryClassificationEvaluator
evaluator = ____