En iyi sonuçları analiz etme
Günün sonunda, bir grid search içindeki en iyi performans gösteren 'kare' ile ilgileniyoruz. Neyse ki Scikit Learn'ün gridSearchCv nesnelerinde yalnızca en iyi kareye (veya cv_results_ içindeki satıra) dair önemli bilgileri veren birkaç parametre var.
İnceleyeceğin üç özellik:
best_score_– En iyi performans gösteren karenin skoru (burada ROC_AUC).best_index_– En iyi performans gösteren kareye ait bilgileri içerencv_results_içindeki satırın indeksi.best_params_– En iyi skoru veren parametrelerin sözlüğü; örneğin'max_depth': 10
grid_rf_class adlı grid search nesnesi hazır durumda.
Senin için satır 6'da cv_results_'dan oluşturulmuş bir dataframe (cv_results_df) var. Bu, sonuçlarda indeksleme yapmana yardımcı olacak.
Bu egzersiz
Python'da Hiperparametre Ayarlama
kursunun bir parçasıdırEgzersiz talimatları
grid_rf_classiçindeki en iyi performans gösteren kareden ROC_AUC skorunu çıkar ve yazdır.cv_results_dfiçinde indeksleme yaparak en iyi performans gösteren satırdan bir değişken oluştur.grid_rf_classiçindeki en iyi performans gösteren karedenn_estimatorsparametresini çıkararakbest_n_estimatorsadlı bir değişken oluştur ve yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Print out the ROC_AUC score from the best-performing square
best_score = grid_rf_class._____
print(best_score)
# Create a variable from the row related to the best-performing square
cv_results_df = pd.DataFrame(grid_rf_class.cv_results_)
best_row = cv_results_df.loc[[grid_rf_class.____]]
print(best_row)
# Get the n_estimators parameter from the best-performing square and print
best_n_estimators = grid_rf_class.____["_____"]
print(best_n_estimators)