Model random forest
Dalam latihan ini, Anda akan menggunakan fungsi randomForest() dari paket randomForest untuk membangun model random forest guna memprediksi churn pelanggan pada himpunan data pelatihan, training_set. Variabel target bernama Future.
Anda juga akan meninjau dan memvisualisasikan tingkat kepentingan variabel dalam model.
Latihan ini adalah bagian dari kursus
Analitik Prediktif menggunakan Data Berjejaring di R
Petunjuk latihan
- Muat paket
randomForest. - Gunakan fungsi
set.seed()dengan seed 863. - Bangun random forest menggunakan fungsi
randomForest()dan semua variabel ditraining_set. Variabel responsFutureperlu bertipe factor, jadi gunakan fungsias.factor(). - Plot kepentingan variabel dari model random forest menggunakan
varImpPlot().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Load package
___(randomForest)
# Set seed
set.seed(___)
# Build model
rfModel <- ___(as.factor(___)~. ,data=training_set)
# Plot variable importance
varImpPlot(___)