Menjelajahi hasil grid search
Sekarang Anda akan menelusuri properti cv_results_ dari objek GridSearchCV yang didefinisikan dalam video. Ini adalah sebuah dictionary yang dapat kita baca ke dalam pandas DataFrame dan berisi banyak informasi berguna tentang grid search yang baru saja kita lakukan.
Pengingat mengenai berbagai tipe kolom dalam properti ini:
- kolom
time_ - kolom
param_(satu untuk setiap hyperparameter) dan kolomparamstunggal (dengan semua pengaturan hyperparameter) - satu kolom
train_scoreuntuk setiap lipatan cv termasuk kolommean_train_scoredanstd_train_score - satu kolom
test_scoreuntuk setiap lipatan cv termasuk kolommean_test_scoredanstd_test_score - satu kolom
rank_test_scoredengan angka dari 1 hingga n (jumlah iterasi) yang memberi peringkat baris berdasarkanmean_test_score
Latihan ini adalah bagian dari kursus
Penyetelan Hyperparameter di Python
Petunjuk latihan
- Baca properti
cv_results_dari objek GridSearchCVgrid_rf_classke dalam sebuah data frame & cetak seluruhnya untuk diperiksa. - Ekstrak & cetak kolom tunggal yang berisi dictionary semua hyperparameter yang digunakan pada setiap iterasi grid search.
- Ekstrak & cetak baris yang memiliki mean test score terbaik dengan melakukan pengindeksan menggunakan kolom
rank_test_score.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Read the cv_results property into a dataframe & print it out
cv_results_df = pd.DataFrame(grid_rf_class.____)
print(____)
# Extract and print the column with a dictionary of hyperparameters used
column = cv_results_df.loc[:, [____]]
print(____)
# Extract and print the row that had the best mean test score
best_row = cv_results_df[cv_results_df[____] == ____ ]
print(best_row)