Menganalisis hasil terbaik
Pada akhirnya, yang paling kita perhatikan adalah 'kotak' dengan kinerja terbaik dalam grid search. Untungnya, objek gridSearchCv di Scikit Learn memiliki sejumlah parameter yang memberikan informasi kunci hanya tentang kotak terbaik (atau baris dalam cv_results_).
Tiga properti yang akan Anda jelajahi adalah:
best_score_– Skor (di sini ROC_AUC) dari kotak dengan kinerja terbaik.best_index_– Indeks baris dalamcv_results_yang memuat informasi tentang kotak dengan kinerja terbaik.best_params_– Dictionary parameter yang menghasilkan skor terbaik, misalnya'max_depth': 10
Objek grid search grid_rf_class tersedia.
Sebuah dataframe (cv_results_df) telah dibuat dari cv_results_ untuk Anda pada baris 6. Ini akan membantu Anda melakukan indeks ke hasil.
Latihan ini adalah bagian dari kursus
Penyetelan Hyperparameter di Python
Petunjuk latihan
- Ekstrak dan cetak skor ROC_AUC dari kotak berkinerja terbaik dalam
grid_rf_class. - Buat variabel dari baris berkinerja terbaik dengan melakukan indeks pada
cv_results_df. - Buat variabel
best_n_estimatorsdengan mengekstrak parametern_estimatorsdari kotak berkinerja terbaik dalamgrid_rf_classdan cetak nilainya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Print out the ROC_AUC score from the best-performing square
best_score = grid_rf_class._____
print(best_score)
# Create a variable from the row related to the best-performing square
cv_results_df = pd.DataFrame(grid_rf_class.cv_results_)
best_row = cv_results_df.loc[[grid_rf_class.____]]
print(best_row)
# Get the n_estimators parameter from the best-performing square and print
best_n_estimators = grid_rf_class.____["_____"]
print(best_n_estimators)