Maak de evaluator
Het eerste wat je nodig hebt bij cross-validatie voor modelselectie is een manier om verschillende modellen te vergelijken. Gelukkig heeft de submodule pyspark.ml.evaluation klassen om verschillende soorten modellen te evalueren. Jouw model is een binaire classificatie, dus je gebruikt de BinaryClassificationEvaluator uit de module pyspark.ml.evaluation.
Deze evaluator berekent de oppervlakte onder de ROC-curve. Dit is een metriek die de twee soorten fouten die een binaire classifier kan maken (false positives en false negatives) samenvoegt tot één simpel getal. Aan het einde van dit hoofdstuk leer je hier meer over!
Deze oefening maakt deel uit van de cursus
Basis van PySpark
Oefeninstructies
- Importeer de submodule
pyspark.ml.evaluationalsevals. - Maak
evaluatordoorevals.BinaryClassificationEvaluator()aan te roepen met het argumentmetricName="areaUnderROC".
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Import the evaluation submodule
import ____ as evals
# Create a BinaryClassificationEvaluator
evaluator = ____