Evaluasi pohon optimal
Pada latihan ini, Anda akan mengevaluasi skor ROC AUC himpunan uji dari model optimal milik grid_dt.
Untuk melakukannya, Anda terlebih dahulu akan menentukan probabilitas memperoleh label positif untuk setiap observasi pada himpunan uji. Anda dapat menggunakan metode predict_proba() dari suatu pengklasifikasi scikit-learn untuk menghitung array 2D yang berisi probabilitas label kelas negatif dan positif masing-masing pada kolom.
Himpunan data sudah dimuat dan diproses untuk Anda (fitur numerik telah distandardisasi); data dibagi menjadi 80% latih dan 20% uji. X_test, y_test tersedia di ruang kerja Anda. Selain itu, kami juga telah memuat objek GridSearchCV terlatih grid_dt yang Anda inisialisasi pada latihan sebelumnya. Perhatikan bahwa grid_dt dilatih sebagai berikut:
grid_dt.fit(X_train, y_train)
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di Python
Petunjuk latihan
Impor
roc_auc_scoredarisklearn.metrics.Ekstrak atribut
.best_estimator_darigrid_dtdan tetapkan kebest_model.Prediksi probabilitas himpunan uji untuk memperoleh kelas positif
y_pred_proba.Hitung skor ROC AUC himpunan uji
test_roc_aucdaribest_model.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Import roc_auc_score from sklearn.metrics
____
# Extract the best estimator
best_model = ____
# Predict the test set probabilities of the positive class
y_pred_proba = ____
# Compute test_roc_auc
test_roc_auc = ____
# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))