Bangun model random forest
Di sini Anda akan menggunakan data cross-validation yang sama untuk membangun (menggunakan train) dan mengevaluasi (menggunakan validate) random forest untuk setiap partisi. Karena Anda menggunakan partisi cross-validation yang sama seperti pada model regresi, Anda dapat membandingkan kinerja kedua model secara langsung.
Catatan: Kita akan membatasi random forest agar hanya berisi 100 pohon untuk memastikan proses pelatihan selesai dalam waktu yang wajar. Jumlah pohon bawaan untuk ranger() adalah 500.
Latihan ini adalah bagian dari kursus
Machine Learning di Tidyverse
Petunjuk latihan
- Gunakan
ranger()untuk membangun random forest yang memprediksilife_expectancymenggunakan semua fitur dalamtrainuntuk setiap partisi cross-validation. - Tambahkan kolom baru
validate_predictedyang memprediksilife_expectancyuntuk observasi dalamvalidatemenggunakan model random forest yang baru Anda buat.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
library(ranger)
# Build a random forest model for each fold
cv_models_rf <- cv_data %>%
mutate(model = map(___, ~ranger(formula = ___, data = ___,
num.trees = 100, seed = 42)))
# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>%
mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))