Selaraskan model Anda
Wah! Itu peningkatan yang signifikan dibandingkan model regresi. Sekarang mari lihat apakah Anda bisa meningkatkan kinerja ini lebih jauh dengan menyetel halus model random forest Anda. Untuk melakukannya, Anda akan mengubah parameter mtry saat membangun model random forest pada data train Anda.
Nilai default mtry untuk ranger adalah akar kuadrat dari total jumlah fitur (6) yang dibulatkan ke bawah. Ini menghasilkan nilai 2.
Latihan ini adalah bagian dari kursus
Machine Learning di Tidyverse
Petunjuk latihan
- Gunakan
crossing()untuk memperluas data validasi silang untuk nilaimtrydari 2 hingga 5. - Bangun model random forest untuk setiap kombinasi fold/mtry.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Prepare for tuning your cross validation folds by varying mtry
cv_tune <- cv_data %>%
crossing(mtry = ___:___)
# Build a model for each fold & mtry combination
cv_model_tunerf <- cv_tune %>%
mutate(model = map2(.x = ___, .y = ___, ~ranger(formula = life_expectancy~.,
data = .x, mtry = .y,
num.trees = 100, seed = 42)))