Selaraskan model Anda
Wah! Itu peningkatan yang signifikan dibandingkan model regresi. Sekarang mari lihat apakah Anda bisa meningkatkan kinerja ini lebih jauh dengan menyetel halus model random forest Anda. Untuk melakukannya, Anda akan mengubah parameter mtry saat membangun model random forest pada data train Anda.
Nilai default mtry untuk ranger adalah akar kuadrat dari total jumlah fitur (6) yang dibulatkan ke bawah. Ini menghasilkan nilai 2.
Latihan ini merupakan bagian dari kursus
Machine Learning di Tidyverse
Instruksi latihan
- Gunakan
crossing()untuk memperluas data validasi silang untuk nilaimtrydari 2 hingga 5. - Bangun model random forest untuk setiap kombinasi fold/mtry.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Prepare for tuning your cross validation folds by varying mtry
cv_tune <- cv_data %>%
crossing(mtry = ___:___)
# Build a model for each fold & mtry combination
cv_model_tunerf <- cv_tune %>%
mutate(model = map2(.x = ___, .y = ___, ~ranger(formula = life_expectancy~.,
data = .x, mtry = .y,
num.trees = 100, seed = 42)))