MulaiMulai sekarang secara gratis

Masuk ke matriks

Anda telah mengidentifikasi enam nilai berbeda untuk EducationField. Namun, Anda menduga bahwa nilai lain mungkin muncul saat Anda menjalankan model pada data baru. Untuk mengantisipasi hal ini, Anda akan membuat indeks hash dengan 50 term. Paket textrecipes serta pemisahan attrition_train dan attrition_test sudah dimuat.

Latihan ini adalah bagian dari kursus

Rekayasa Fitur di R

Lihat Kursus

Petunjuk latihan

  • Tambahkan sebuah langkah pada recipe yang menghasilkan indeks dummy_hash untuk EducationField.
  • Siapkan recipe tersebut.
  • Panggang (bake) recipe yang sudah disiapkan.
  • Gabungkan tabel recipe yang telah dipanggang dan nilai EducationField ke dalam satu tabel, lalu cetak 7 baris pertama, serta kolom ke-1 dan ke-18 hingga ke-20.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
  ___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)

# Prepare the recipe
object <- recipe %>%
  ___

# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)

# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]
Edit dan Jalankan Kode