Proses rekayasa fitur
Untuk memasukkan rekayasa fitur ke dalam proses pemodelan, himpunan data pelatihan dan pengujian harus dipraproses sebelum tahap pemodelan. Dengan keterampilan baru yang Anda pelajari di bab ini, Anda akan dapat menggunakan semua variabel prediktor yang tersedia pada data telekomunikasi untuk melatih model regresi logistik Anda.
Dalam latihan ini, Anda akan membuat pipeline rekayasa fitur pada data telekomunikasi dan menggunakannya untuk mentransformasi himpunan data pelatihan dan pengujian.
Himpunan data telecom_training dan telecom_test serta spesifikasi model regresi logistik Anda, logistic_model, telah dimuat ke sesi Anda.
Latihan ini adalah bagian dari kursus
Pemodelan dengan tidymodels di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
telecom_recipe <- recipe(___, data = ___) %>%
# Removed correlated predictors
___(___) %>%
# Log transform numeric predictors
___(___, base = 10) %>%
# Normalize numeric predictors
___(___) %>%
# Create dummy variables
___(___, ___)