Membangun model tereduksi
Analisis tingkat kepentingan variabel membantu Anda mengidentifikasi fitur yang paling prediktif dari himpunan data attrition. Berdasarkan hal tersebut, Anda akan membangun model yang sangat tereduksi hanya dengan tiga variabel: OverTime, DistanceFromHome, dan NumCompaniesWorked lalu membandingkan kinerjanya dengan model penuh sebagai tolok ukur. Metrik yang Anda estimasi untuk model penuh disimpan dalam aug_full.
Seluruh data, beserta pembagian train dan test, tersedia di lingkungan Anda.
Latihan ini adalah bagian dari kursus
Rekayasa Fitur di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a recipe using the formula syntax that includes only OverTime, DistanceFromHome and NumCompaniesWorked as predictors
recipe_reduced <-
___(Attrition ~ ___ + ___ + ___, data = train)
# Bundle the recipe with your model
workflow_reduced <-
workflow() %>%
add_model(model) %>%
___