Pencarian grid
Ingat bahwa kita telah membuat model Gradient Boosting dasar pada pelajaran sebelumnya. Tujuan Anda sekarang adalah menemukan nilai hyperparameter max_depth terbaik untuk model Gradient Boosting ini. Hyperparameter ini membatasi jumlah node pada setiap pohon individual. Anda akan menggunakan validasi silang K-fold untuk mengukur kinerja lokal model untuk setiap nilai hyperparameter.
Anda diberikan sebuah fungsi get_cv_score() yang menerima himpunan data latih dan kamus parameter model sebagai argumen, lalu mengembalikan skor RMSE validasi keseluruhan dari validasi silang 3-fold.
Latihan ini adalah bagian dari kursus
Memenangi Kompetisi Kaggle dengan Python
Petunjuk latihan
- Tentukan grid untuk kemungkinan nilai
max_depthdengan 3, 6, 9, 12, dan 15. - Teruskan setiap kandidat hyperparameter dalam grid ke kamus
paramsmodel.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Possible max depth values
max_depth_grid = [____]
results = {}
# For each value in the grid
for max_depth_candidate in max_depth_grid:
# Specify parameters for the model
params = {'max_depth': ____}
# Calculate validation score for a particular hyperparameter
validation_score = get_cv_score(train, params)
# Save the results for each max depth value
results[max_depth_candidate] = validation_score
print(results)