Buat model random forest lengkap
Model random forest secara alami melakukan pemilihan fitur karena membangun banyak subtree dari subset fitur yang acak. Salah satu cara untuk memahami kepentingan fitur adalah dengan membangun model lalu mengekstrak nilai kepentingan fitur tersebut. Jadi, pada latihan ini, Anda akan menggunakan data Healthcare Job Attrition untuk melatih model klasifikasi rand_forest() yang darinya Anda dapat mengekstrak kepentingan fitur. Agar kepentingan fitur tersedia, pastikan membuat model dengan importance = "impurity". Himpunan data train dan test telah disediakan untuk Anda.
Pustaka tidyverse, tidymodels, dan vip telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Definisikan model klasifikasi random forest dengan 200 tree yang dapat Anda gunakan untuk mengekstrak kepentingan fitur.
- Fit model random forest dengan semua prediktor.
- Ikatkan prediksi ke himpunan data uji.
- Hitung metrik F1.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Specify the random forest model
rf_spec <- ___(mode = "___", ___ = ___) %>%
set_engine("___", ___ = "___")
# Fit the random forest model with all predictors
rf_fit <- ___ %>%
___(___, data = ___)
# Create the test set prediction data frame
predict_df <- ___ %>%
bind_cols(predict = ___(___, ___))
# Calculate F1 performance
f_meas(predict_df, ___, .pred_class)