IniziaInizia gratis

Crea l'evaluator

La prima cosa di cui hai bisogno quando fai la cross validation per la selezione del modello è un modo per confrontare modelli diversi. Per fortuna, il sottomodulo pyspark.ml.evaluation offre classi per valutare vari tipi di modelli. Il tuo è un modello di classificazione binaria, quindi userai BinaryClassificationEvaluator dal modulo pyspark.ml.evaluation.

Questo evaluator calcola l'area sotto la ROC. È una metrica che combina i due tipi di errori che un classificatore binario può commettere (falsi positivi e falsi negativi) in un singolo numero. Ne parlerai più nel dettaglio verso la fine del capitolo!

Questo esercizio fa parte del corso

Fondamenti di PySpark

Visualizza il corso

Istruzioni dell'esercizio

  • Importa il sottomodulo pyspark.ml.evaluation come evals.
  • Crea evaluator chiamando evals.BinaryClassificationEvaluator() con l'argomento metricName="areaUnderROC".

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Import the evaluation submodule
import ____ as evals

# Create a BinaryClassificationEvaluator
evaluator = ____
Modifica ed esegui il codice