Mulai sekarangMulai gratis

Buat evaluator

Hal pertama yang Anda perlukan saat melakukan validasi silang untuk pemilihan model adalah cara membandingkan berbagai model. Untungnya, submodul pyspark.ml.evaluation memiliki kelas-kelas untuk mengevaluasi berbagai jenis model. Model Anda adalah model klasifikasi biner, jadi Anda akan menggunakan BinaryClassificationEvaluator dari modul pyspark.ml.evaluation.

Evaluator ini menghitung area di bawah kurva ROC. Ini adalah metrik yang menggabungkan dua jenis kesalahan yang dapat dibuat oleh pengklasifikasi biner (positif palsu dan negatif palsu) menjadi sebuah angka sederhana. Anda akan mempelajari lebih lanjut tentang hal ini di akhir bab!

Latihan ini merupakan bagian dari kursus

Dasar-Dasar PySpark

Lihat Kursus

Instruksi latihan

  • Impor submodul pyspark.ml.evaluation sebagai evals.
  • Buat evaluator dengan memanggil evals.BinaryClassificationEvaluator() dengan argumen metricName="areaUnderROC".

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Import the evaluation submodule
import ____ as evals

# Create a BinaryClassificationEvaluator
evaluator = ____
Edit dan Jalankan Kode