MulaiMulai sekarang secara gratis

Melampaui sekadar akurasi

Dalam latihan ini, untuk melampaui sekadar melihat akurasi, Anda akan mengevaluasi AUC dari kurva ROC untuk model decision tree dasar. Ingat bahwa pembanding dasar untuk pengklasifikasi acak adalah AUC sebesar 0,5, sehingga Anda sebaiknya meraih skor lebih tinggi daripada 0,5.

X tersedia sebagai DataFrame berisi fitur, dan y tersedia sebagai DataFrame berisi nilai target. sklearn dan pandas sebagai pd juga tersedia di ruang kerja Anda.

Kita akan menggunakan susunan ini untuk melihat AUC dari kurva ROC kita.

Latihan ini adalah bagian dari kursus

Memprediksi CTR dengan Machine Learning di Python

Lihat Kursus

Petunjuk latihan

  • Bagi data menjadi himpunan pelatihan dan pengujian.
  • Latih pengklasifikasi menggunakan data pelatihan untuk membuat prediksi pada data pengujian menggunakan predict_proba() dan predict().
  • Evaluasi AUC di bawah kurva ROC menggunakan fungsi roc_curve() pada y_test melalui roc_curve(y_test, y_score[:, 1]).

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Training and testing
X_train, X_test, y_train, y_test = \
	____(X, y, test_size = .2, random_state = 0)

# Create decision tree classifier
clf = DecisionTreeClassifier()

# Train classifier - predict probability score and label
y_score = clf.fit(____, ____).predict_proba(____) 
y_pred = clf.fit(____, ____).predict(____) 

# Get ROC curve metrics
fpr, tpr, thresholds = ____(____, y_score[:, 1])
roc_auc = auc(fpr, tpr)
print(roc_auc)
Edit dan Jalankan Kode