MulaiMulai sekarang secara gratis

Bangun model random forest

Di sini Anda akan menggunakan data cross-validation yang sama untuk membangun (menggunakan train) dan mengevaluasi (menggunakan validate) random forest untuk setiap partisi. Karena Anda menggunakan partisi cross-validation yang sama seperti pada model regresi, Anda dapat membandingkan kinerja kedua model secara langsung.

Catatan: Kita akan membatasi random forest agar hanya berisi 100 pohon untuk memastikan proses pelatihan selesai dalam waktu yang wajar. Jumlah pohon bawaan untuk ranger() adalah 500.

Latihan ini adalah bagian dari kursus

Machine Learning di Tidyverse

Lihat Kursus

Petunjuk latihan

  • Gunakan ranger() untuk membangun random forest yang memprediksi life_expectancy menggunakan semua fitur dalam train untuk setiap partisi cross-validation.
  • Tambahkan kolom baru validate_predicted yang memprediksi life_expectancy untuk observasi dalam validate menggunakan model random forest yang baru Anda buat.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

library(ranger)

# Build a random forest model for each fold
cv_models_rf <- cv_data %>% 
  mutate(model = map(___, ~ranger(formula = ___, data = ___,
                                    num.trees = 100, seed = 42)))

# Generate predictions using the random forest model
cv_prep_rf <- cv_models_rf %>% 
  mutate(validate_predicted = map2(.x = ___, .y = ___, ~predict(.x, .y)$predictions))
Edit dan Jalankan Kode