Den Evaluator erstellen
Wenn du eine Kreuzvalidierung für die Modellauswahl durchführst, brauchst du zuerst eine Möglichkeit, verschiedene Modelle zu vergleichen. Zum Glück hat das Untermodul pyspark.ml.evaluation Klassen für die Auswertung verschiedener Modelle. Da es sich bei deinem Modell um ein binäres Klassifizierungsmodell handelt, verwendest du den BinaryClassificationEvaluator aus dem Modul pyspark.ml.evaluation.
Dieser Evaluator berechnet die Fläche unter ROC. Dies ist ein Maß, das die beiden Arten von Fehlern, die ein binärer Klassifikator machen kann (falsch-positiv und falsch-negativ), in einer einzigen Zahl zusammenfasst. Am Ende dieses Kapitels erfährst du mehr darüber!
Diese Übung ist Teil des Kurses
Einführung in PySpark
Anleitung zur Übung
- Importiere das Untermodul
pyspark.ml.evaluationalsevals. - Erstelle
evaluator, indem duevals.BinaryClassificationEvaluator()mit dem ArgumentmetricName="areaUnderROC"aufrufst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Import the evaluation submodule
import ____ as evals
# Create a BinaryClassificationEvaluator
evaluator = ____