Bangun model random forest
Di sini Anda akan menggunakan data cross-validation yang sama untuk membangun (menggunakan train) dan mengevaluasi (menggunakan validate) random forest untuk setiap partisi. Karena Anda menggunakan partisi cross-validation yang sama seperti pada model regresi, Anda dapat membandingkan kinerja kedua model secara langsung.
Catatan: Kita akan membatasi random forest agar hanya berisi 100 pohon untuk memastikan proses pelatihan selesai dalam waktu yang wajar. Jumlah pohon bawaan untuk ranger() adalah 500.
Latihan ini merupakan bagian dari kursus
Machine Learning di Tidyverse
Instruksi latihan
- Gunakan
ranger()untuk membangun random forest yang memprediksilife_expectancymenggunakan semua fitur dalamtrainuntuk setiap partisi cross-validation. - Tambahkan kolom baru
validate_predictedyang memprediksilife_expectancyuntuk observasi dalamvalidatemenggunakan model random forest yang baru Anda buat.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
library(ranger)
# Build a random forest model for each fold
cv_models_rf <- cv_data %>%
mutate(model = map(___, ~ranger(formula = ___, data = ___,
num.trees = 100, seed = 42)))
# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))