En iyi ağacı değerlendir
Bu egzersizde, grid_dt'nin en iyi modelinin test seti ROC AUC skorunu değerlendireceksin.
Bunu yapmak için önce test setindeki her gözlem için pozitif etiketin elde edilme olasılığını belirleyeceksin. Bir sklearn sınıflandırıcısının predict_proba() metodunu kullanarak, sütunlar boyunca sırasıyla negatif ve pozitif sınıf etiketlerinin olasılıklarını içeren 2B bir dizi hesaplayabilirsin.
Veri kümesi senin için zaten yüklendi ve işlendi (sayısal özellikler standartlaştırıldı); veri %80 eğitim ve %20 test olarak bölündü. X_test, y_test çalışma alanında mevcut. Ayrıca, önceki egzersizde örneklediğin ve eğitilmiş GridSearchCV nesnesi grid_dt de yüklendi. grid_dt aşağıdaki gibi eğitildiğine dikkat et:
grid_dt.fit(X_train, y_train)
Bu egzersiz
Python ile Ağaç Tabanlı Modellerle Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
sklearn.metricsiçindenroc_auc_score'u içe aktar.grid_dt'den.best_estimator_özniteliğini çıkar vebest_modeldeğişkenine ata.Test setinde pozitif sınıfı elde etme olasılıklarını
y_pred_probaolarak tahmin et.best_modeliçin test seti ROC AUC skorunutest_roc_aucolarak hesapla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Import roc_auc_score from sklearn.metrics
____
# Extract the best estimator
best_model = ____
# Predict the test set probabilities of the positive class
y_pred_proba = ____
# Compute test_roc_auc
test_roc_auc = ____
# Print test_roc_auc
print('Test set ROC AUC score: {:.3f}'.format(test_roc_auc))