1. Učit se
  2. /
  3. Kurzy
  4. /
  5. Foundations of PySpark

Connected

Cvičení

Vytvoření evaluátoru

Při křížové validaci pro výběr modelu potřebuješ nejdřív způsob, jak jednotlivé modely porovnat. Naštěstí submodul pyspark.ml.evaluation obsahuje třídy pro vyhodnocování různých typů modelů. Tvůj model je binární klasifikační model, takže využiješ BinaryClassificationEvaluator z modulu pyspark.ml.evaluation.

Tento evaluátor vypočítá plochu pod ROC křivkou. Jde o metriku, která kombinuje oba typy chyb, které může binární klasifikátor udělat (falešně pozitivní a falešně negativní výsledky), do jediného čísla. Víc se o tom dozvíš ke konci kapitoly!

Pokyny

100 XP
  • Importuj submodul pyspark.ml.evaluation jako evals.
  • Vytvoř proměnnou evaluator voláním evals.BinaryClassificationEvaluator() s argumentem metricName="areaUnderROC".