Buat evaluator
Hal pertama yang Anda perlukan saat melakukan validasi silang untuk pemilihan model adalah cara membandingkan berbagai model. Untungnya, submodul pyspark.ml.evaluation memiliki kelas-kelas untuk mengevaluasi berbagai jenis model. Model Anda adalah model klasifikasi biner, jadi Anda akan menggunakan BinaryClassificationEvaluator dari modul pyspark.ml.evaluation.
Evaluator ini menghitung area di bawah kurva ROC. Ini adalah metrik yang menggabungkan dua jenis kesalahan yang dapat dibuat oleh pengklasifikasi biner (positif palsu dan negatif palsu) menjadi sebuah angka sederhana. Anda akan mempelajari lebih lanjut tentang hal ini di akhir bab!
Latihan ini merupakan bagian dari kursus
Dasar-Dasar PySpark
Instruksi latihan
- Impor submodul
pyspark.ml.evaluationsebagaievals. - Buat
evaluatordengan memanggilevals.BinaryClassificationEvaluator()dengan argumenmetricName="areaUnderROC".
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Import the evaluation submodule
import ____ as evals
# Create a BinaryClassificationEvaluator
evaluator = ____