Aan de slagGa gratis aan de slag

Maak de evaluator

Het eerste wat je nodig hebt bij cross-validatie voor modelselectie is een manier om verschillende modellen te vergelijken. Gelukkig heeft de submodule pyspark.ml.evaluation klassen om verschillende soorten modellen te evalueren. Jouw model is een binaire classificatie, dus je gebruikt de BinaryClassificationEvaluator uit de module pyspark.ml.evaluation.

Deze evaluator berekent de oppervlakte onder de ROC-curve. Dit is een metriek die de twee soorten fouten die een binaire classifier kan maken (false positives en false negatives) samenvoegt tot één simpel getal. Aan het einde van dit hoofdstuk leer je hier meer over!

Deze oefening maakt deel uit van de cursus

Basis van PySpark

Cursus bekijken

Oefeninstructies

  • Importeer de submodule pyspark.ml.evaluation als evals.
  • Maak evaluator door evals.BinaryClassificationEvaluator() aan te roepen met het argument metricName="areaUnderROC".

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Import the evaluation submodule
import ____ as evals

# Create a BinaryClassificationEvaluator
evaluator = ____
Code bewerken en uitvoeren