Crea l'evaluator
La prima cosa di cui hai bisogno quando fai la cross validation per la selezione del modello è un modo per confrontare modelli diversi. Per fortuna, il sottomodulo pyspark.ml.evaluation offre classi per valutare vari tipi di modelli. Il tuo è un modello di classificazione binaria, quindi userai BinaryClassificationEvaluator dal modulo pyspark.ml.evaluation.
Questo evaluator calcola l'area sotto la ROC. È una metrica che combina i due tipi di errori che un classificatore binario può commettere (falsi positivi e falsi negativi) in un singolo numero. Ne parlerai più nel dettaglio verso la fine del capitolo!
Questo esercizio fa parte del corso
Fondamenti di PySpark
Istruzioni dell'esercizio
- Importa il sottomodulo
pyspark.ml.evaluationcomeevals. - Crea
evaluatorchiamandoevals.BinaryClassificationEvaluator()con l'argomentometricName="areaUnderROC".
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Import the evaluation submodule
import ____ as evals
# Create a BinaryClassificationEvaluator
evaluator = ____