MulaiMulai sekarang secara gratis

Selesaikan pipeline rekayasa fitur

Paket recipes dirancang untuk mengenkode beberapa langkah rekayasa fitur ke dalam satu objek, sehingga memudahkan pemeliharaan transformasi data dalam alur kerja Machine Learning.

Dalam latihan ini, Anda akan melatih sebuah pipeline rekayasa fitur untuk menyiapkan data telekomunikasi agar siap untuk pemodelan.

Tabel tibble telecom_df, serta himpunan data telecom_training dan telecom_test dari latihan sebelumnya, telah dimuat ke ruang kerja Anda.

Latihan ini adalah bagian dari kursus

Pemodelan dengan tidymodels di R

Lihat Kursus

Petunjuk latihan

  • Buat sebuah recipe yang memprediksi canceled_service menggunakan semua variabel prediktor pada data latih.
  • Hapus variabel prediktor yang berkorelasi dengan menggunakan nilai ambang 0,8.
  • Normalkan semua prediktor numerik.
  • Buat variabel dummy untuk semua prediktor nominal.
  • Latih recipe Anda pada data latih dan terapkan ke data uji.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a recipe that predicts canceled_service using the training data
telecom_recipe <- ___ %>% 
  # Remove correlated predictors
  ___ %>% 
  # Normalize numeric predictors
  ___ %>% 
  # Create dummy variables
  ___

# Train your recipe and apply it to the test data
telecom_recipe %>% 
  ___ %>% 
  ___
Edit dan Jalankan Kode