MulaiMulai sekarang secara gratis

Menghapus prediktor berkorelasi dengan recipes

Menghapus variabel prediktor yang berkorelasi dari himpunan data pelatihan dan pengujian merupakan langkah feature engineering penting agar proses pemodelan berjalan sehalus mungkin.

Sekarang setelah Anda mengetahui bahwa monthly_charges dan avg_data_gb sangat berkorelasi, Anda perlu menambahkan penyaring korelasi dengan step_corr() ke pipeline feature engineering untuk data telekomunikasi.

Dalam latihan ini, Anda akan membuat objek recipe yang menghapus prediktor berkorelasi dari data telekomunikasi.

Himpunan data telecom_training dan telecom_test telah dimuat ke sesi Anda.

Latihan ini adalah bagian dari kursus

Pemodelan dengan tidymodels di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Specify a recipe object
telecom_cor_rec <- recipe(___,
                          data = ___) %>%
  # Remove correlated variables
  ___(___, threshold = ___)
Edit dan Jalankan Kode