Bangun model random forest

Di sini Anda akan menggunakan data cross-validation yang sama untuk membangun (menggunakan train) dan mengevaluasi (menggunakan validate) random forest untuk setiap partisi. Karena Anda menggunakan partisi cross-validation yang sama seperti pada model regresi, Anda dapat membandingkan kinerja kedua model secara langsung.

Catatan: Kita akan membatasi random forest agar hanya berisi 100 pohon untuk memastikan proses pelatihan selesai dalam waktu yang wajar. Jumlah pohon bawaan untuk ranger() adalah 500.

Latihan ini merupakan bagian dari kursus

Machine Learning di Tidyverse

Lihat Kursus

Instruksi latihan

Gunakan ranger() untuk membangun random forest yang memprediksi life_expectancy menggunakan semua fitur dalam train untuk setiap partisi cross-validation.
Tambahkan kolom baru validate_predicted yang memprediksi life_expectancy untuk observasi dalam validate menggunakan model random forest yang baru Anda buat.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

library(ranger)

# Build a random forest model for each fold
cv_models_rf <- cv_data %>% 
  mutate(model = map(___, ~ranger(formula = ___, data = ___,
                                    num.trees = 100, seed = 42)))

# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))

Edit dan Jalankan Kode