MulaiMulai sekarang secara gratis

Buat evaluator

Hal pertama yang Anda perlukan saat melakukan validasi silang untuk pemilihan model adalah cara membandingkan berbagai model. Untungnya, submodul pyspark.ml.evaluation memiliki kelas-kelas untuk mengevaluasi berbagai jenis model. Model Anda adalah model klasifikasi biner, jadi Anda akan menggunakan BinaryClassificationEvaluator dari modul pyspark.ml.evaluation.

Evaluator ini menghitung area di bawah kurva ROC. Ini adalah metrik yang menggabungkan dua jenis kesalahan yang dapat dibuat oleh pengklasifikasi biner (positif palsu dan negatif palsu) menjadi sebuah angka sederhana. Anda akan mempelajari lebih lanjut tentang hal ini di akhir bab!

Latihan ini adalah bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Petunjuk latihan

  • Impor submodul pyspark.ml.evaluation sebagai evals.
  • Buat evaluator dengan memanggil evals.BinaryClassificationEvaluator() dengan argumen metricName="areaUnderROC".

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import the evaluation submodule
import ____ as evals

# Create a BinaryClassificationEvaluator
evaluator = ____
Edit dan Jalankan Kode