LoslegenKostenlos loslegen

Den Evaluator erstellen

Wenn du eine Kreuzvalidierung für die Modellauswahl durchführst, brauchst du zuerst eine Möglichkeit, verschiedene Modelle zu vergleichen. Zum Glück hat das Untermodul pyspark.ml.evaluation Klassen für die Auswertung verschiedener Modelle. Da es sich bei deinem Modell um ein binäres Klassifizierungsmodell handelt, verwendest du den BinaryClassificationEvaluator aus dem Modul pyspark.ml.evaluation.

Dieser Evaluator berechnet die Fläche unter ROC. Dies ist ein Maß, das die beiden Arten von Fehlern, die ein binärer Klassifikator machen kann (falsch-positiv und falsch-negativ), in einer einzigen Zahl zusammenfasst. Am Ende dieses Kapitels erfährst du mehr darüber!

Diese Übung ist Teil des Kurses

Einführung in PySpark

Kurs anzeigen

Anleitung zur Übung

  • Importiere das Untermodul pyspark.ml.evaluation als evals.
  • Erstelle evaluator, indem du evals.BinaryClassificationEvaluator() mit dem Argument metricName="areaUnderROC" aufrufst.

Interaktive Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Import the evaluation submodule
import ____ as evals

# Create a BinaryClassificationEvaluator
evaluator = ____
Code bearbeiten und ausführen