Buat workflow recipe–model
Paket tidymodels dapat menggabungkan recipe dan model ke dalam workflow. Workflow memudahkan Anda membuat rangkaian langkah (pipeline) untuk menyiapkan data dan melatih model. Workflow kemudian dapat diterapkan ke data baru dengan mudah, tanpa harus mendefinisikan ulang seluruh langkah prapemrosesan dan pembangunan model. Secara praktis, workflow memiliki fungsi fit() yang menyesuaikan (fit) baik recipe maupun model ke data.
Pada latihan ini, Anda akan berlatih membuat recipe dan model lalu menambahkannya ke dalam workflow, sehingga siap untuk di-fit ke data. Himpunan data train dan test dari data attrition layanan kesehatan karyawan telah tersedia untuk Anda gunakan. Variabel target adalah Attrition.
Paket tidyverse dan tidymodels telah dimuat untuk Anda.
Latihan ini adalah bagian dari kursus
Reduksi Dimensi di R
Petunjuk latihan
- Definisikan sebuah recipe menggunakan data
traindenganstep_filter_missing(),step_scale(), danstep_nzv()untuk masing-masing menghapus NA, menstandarkan fitur numerik, dan menghapus fitur dengan varians rendah. Gunakan ambang 0,5 untukstep_filter_missing(). - Definisikan model regresi logistik menggunakan engine "glm".
- Tambahkan
feature_selection_recipedanlr_modelke workflow bernamaattrition_wflow.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create recipe
feature_selection_recipe <-
___(___ ~ ., data = ___) %>%
___(___(), threshold = 0.5) %>%
___(___()) %>%
___(___()) %>%
prep()
# Create model
lr_model <- ___() %>%
___("___")
# Add recipe and model to a workflow
attrition_wflow <- ___() %>%
___(___) %>%
___(___)