MulaiMulai sekarang secara gratis

Evaluasi pohon optimal

Pada latihan ini, Anda akan mengevaluasi skor ROC AUC himpunan uji dari model optimal milik grid_dt.

Untuk melakukannya, Anda terlebih dahulu akan menentukan probabilitas memperoleh label positif untuk setiap observasi pada himpunan uji. Anda dapat menggunakan metode predict_proba() dari suatu pengklasifikasi scikit-learn untuk menghitung array 2D yang berisi probabilitas label kelas negatif dan positif masing-masing pada kolom.

Himpunan data sudah dimuat dan diproses untuk Anda (fitur numerik telah distandardisasi); data dibagi menjadi 80% latih dan 20% uji. X_test, y_test tersedia di ruang kerja Anda. Selain itu, kami juga telah memuat objek GridSearchCV terlatih grid_dt yang Anda inisialisasi pada latihan sebelumnya. Perhatikan bahwa grid_dt dilatih sebagai berikut:

grid_dt.fit(X_train, y_train)

Latihan ini adalah bagian dari kursus

Machine Learning dengan Model Berbasis Pohon di Python

Lihat Kursus

Petunjuk latihan

  • Impor roc_auc_score dari sklearn.metrics.

  • Ekstrak atribut .best_estimator_ dari grid_dt dan tetapkan ke best_model.

  • Prediksi probabilitas himpunan uji untuk memperoleh kelas positif y_pred_proba.

  • Hitung skor ROC AUC himpunan uji test_roc_auc dari best_model.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Import roc_auc_score from sklearn.metrics
____

# Extract the best estimator
best_model = ____

# Predict the test set probabilities of the positive class
y_pred_proba = ____

# Compute test_roc_auc
test_roc_auc = ____

# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))
Edit dan Jalankan Kode