Selesaikan pipeline rekayasa fitur
Paket recipes dirancang untuk mengenkode beberapa langkah rekayasa fitur ke dalam satu objek, sehingga memudahkan pemeliharaan transformasi data dalam alur kerja Machine Learning.
Dalam latihan ini, Anda akan melatih sebuah pipeline rekayasa fitur untuk menyiapkan data telekomunikasi agar siap untuk pemodelan.
Tabel tibble telecom_df, serta himpunan data telecom_training dan telecom_test dari latihan sebelumnya, telah dimuat ke ruang kerja Anda.
Latihan ini merupakan bagian dari kursus
Pemodelan dengan tidymodels di R
Instruksi latihan
- Buat sebuah recipe yang memprediksi
canceled_servicemenggunakan semua variabel prediktor pada data latih. - Hapus variabel prediktor yang berkorelasi dengan menggunakan nilai ambang 0,8.
- Normalkan semua prediktor numerik.
- Buat variabel dummy untuk semua prediktor nominal.
- Latih recipe Anda pada data latih dan terapkan ke data uji.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>%
# Remove correlated predictors
___ %>%
# Normalize numeric predictors
___ %>%
# Create dummy variables
___
# Train your recipe and apply it to the test data
telecom_recipe %>%
___ %>%
___