Buat evaluator
Hal pertama yang Anda perlukan saat melakukan validasi silang untuk pemilihan model adalah cara membandingkan berbagai model. Untungnya, submodul pyspark.ml.evaluation memiliki kelas-kelas untuk mengevaluasi berbagai jenis model. Model Anda adalah model klasifikasi biner, jadi Anda akan menggunakan BinaryClassificationEvaluator dari modul pyspark.ml.evaluation.
Evaluator ini menghitung area di bawah kurva ROC. Ini adalah metrik yang menggabungkan dua jenis kesalahan yang dapat dibuat oleh pengklasifikasi biner (positif palsu dan negatif palsu) menjadi sebuah angka sederhana. Anda akan mempelajari lebih lanjut tentang hal ini di akhir bab!
Latihan ini adalah bagian dari kursus
Dasar-Dasar PySpark
Petunjuk latihan
- Impor submodul
pyspark.ml.evaluationsebagaievals. - Buat
evaluatordengan memanggilevals.BinaryClassificationEvaluator()dengan argumenmetricName="areaUnderROC".
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import the evaluation submodule
import ____ as evals
# Create a BinaryClassificationEvaluator
evaluator = ____