ComenzarEmpieza gratis

Crear el evaluador

Lo primero que necesitas al hacer la validación cruzada para la selección de modelos es una forma de comparar modelos diferentes. Por suerte, el submódulo pyspark.ml.evaluation tiene clases para evaluar distintos tipos de modelos. Tu modelo es un modelo de clasificación binaria, por lo que utilizarás el BinaryClassificationEvaluator del módulo pyspark.ml.evaluation.

Este evaluador calcula el área bajo el ROC. Se trata de una métrica que combina los dos tipos de errores que puede cometer un clasificador binario (falsos positivos y falsos negativos) en un simple número. Sabrás más sobre esto al final del capítulo.

Este ejercicio forma parte del curso

Introducción a PySpark

Ver curso

Instrucciones del ejercicio

  • Importa el submódulo pyspark.ml.evaluation como evals.
  • Crea evaluator llamando a evals.BinaryClassificationEvaluator() con el argumento metricName="areaUnderROC".

Ejercicio interactivo práctico

Prueba este ejercicio completando el código de muestra.

# Import the evaluation submodule
import ____ as evals

# Create a BinaryClassificationEvaluator
evaluator = ____
Editar y ejecutar código