Selesaikan pipeline rekayasa fitur
Paket recipes dirancang untuk mengenkode beberapa langkah rekayasa fitur ke dalam satu objek, sehingga memudahkan pemeliharaan transformasi data dalam alur kerja Machine Learning.
Dalam latihan ini, Anda akan melatih sebuah pipeline rekayasa fitur untuk menyiapkan data telekomunikasi agar siap untuk pemodelan.
Tabel tibble telecom_df, serta himpunan data telecom_training dan telecom_test dari latihan sebelumnya, telah dimuat ke ruang kerja Anda.
Latihan ini adalah bagian dari kursus
Pemodelan dengan tidymodels di R
Petunjuk latihan
- Buat sebuah recipe yang memprediksi
canceled_servicemenggunakan semua variabel prediktor pada data latih. - Hapus variabel prediktor yang berkorelasi dengan menggunakan nilai ambang 0,8.
- Normalkan semua prediktor numerik.
- Buat variabel dummy untuk semua prediktor nominal.
- Latih recipe Anda pada data latih dan terapkan ke data uji.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___