Crear el evaluador
Lo primero que necesitas al hacer la validación cruzada para la selección de modelos es una forma de comparar modelos diferentes. Por suerte, el submódulo pyspark.ml.evaluation
tiene clases para evaluar distintos tipos de modelos. Tu modelo es un modelo de clasificación binaria, por lo que utilizarás el BinaryClassificationEvaluator
del módulo pyspark.ml.evaluation
.
Este evaluador calcula el área bajo el ROC. Se trata de una métrica que combina los dos tipos de errores que puede cometer un clasificador binario (falsos positivos y falsos negativos) en un simple número. Sabrás más sobre esto al final del capítulo.
Este ejercicio forma parte del curso
Introducción a PySpark
Instrucciones del ejercicio
- Importa el submódulo
pyspark.ml.evaluation
comoevals
. - Crea
evaluator
llamando aevals.BinaryClassificationEvaluator()
con el argumentometricName="areaUnderROC"
.
Ejercicio interactivo práctico
Prueba este ejercicio completando el código de muestra.
# Import the evaluation submodule
import ____ as evals
# Create a BinaryClassificationEvaluator
evaluator = ____