Latih tiap lipatan
Sekarang setelah Anda membagi data menjadi lipatan, saatnya menggunakannya untuk melatih model dan menghitung galat out-of-sample untuk setiap model. Dengan cara ini, Anda memperoleh estimasi yang seimbang atas kinerja spesifikasi model Anda karena Anda mengevaluasinya beberapa kali di luar sampel.
Di ruang kerja Anda tersedia chocolate_folds, yang Anda buat pada latihan sebelumnya (10 lipatan dari himpunan data pelatihan cokelat).
Latihan ini adalah bagian dari kursus
Machine Learning dengan Model Berbasis Pohon di R
Petunjuk latihan
- Tunjukkan bahwa Anda masih bisa: buat
tree_spec, spesifikasi pohon regresi menggunakan engine"rpart". - Gunakan
fit_resamples()untuk menyesuaikan lipatan Anda ketree_spec, memodelkanfinal_grademenggunakan semua prediktor lain dan mengevaluasi dengan MAE dan RMSE.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a specification
tree_spec <- ___ %>%
___
___
# Fit all folds to the specification
fits_cv <- ___(tree_spec,
___,
resamples = ___,
metrics = ___)
fits_cv