Melampaui sekadar akurasi
Dalam latihan ini, untuk melampaui sekadar melihat akurasi, Anda akan mengevaluasi AUC dari kurva ROC untuk model decision tree dasar. Ingat bahwa pembanding dasar untuk pengklasifikasi acak adalah AUC sebesar 0,5, sehingga Anda sebaiknya meraih skor lebih tinggi daripada 0,5.
X tersedia sebagai DataFrame berisi fitur, dan y tersedia sebagai DataFrame berisi nilai target. sklearn dan pandas sebagai pd juga tersedia di ruang kerja Anda.
Kita akan menggunakan susunan ini untuk melihat AUC dari kurva ROC kita.
Latihan ini adalah bagian dari kursus
Memprediksi CTR dengan Machine Learning di Python
Petunjuk latihan
- Bagi data menjadi himpunan pelatihan dan pengujian.
- Latih pengklasifikasi menggunakan data pelatihan untuk membuat prediksi pada data pengujian menggunakan
predict_proba()danpredict(). - Evaluasi AUC di bawah kurva ROC menggunakan fungsi
roc_curve()paday_testmelaluiroc_curve(y_test, y_score[:, 1]).
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Training and testing
X_train, X_test, y_train, y_test = \
____(X, y, test_size = .2, random_state = 0)
# Create decision tree classifier
clf = DecisionTreeClassifier()
# Train classifier - predict probability score and label
y_score = clf.fit(____, ____).predict_proba(____)
y_pred = clf.fit(____, ____).predict(____)
# Get ROC curve metrics
fpr, tpr, thresholds = ____(____, y_score[:, 1])
roc_auc = auc(fpr, tpr)
print(roc_auc)