Mulai sekarangMulai gratis

Masuk ke matriks

Anda telah mengidentifikasi enam nilai berbeda untuk EducationField. Namun, Anda menduga bahwa nilai lain mungkin muncul saat Anda menjalankan model pada data baru. Untuk mengantisipasi hal ini, Anda akan membuat indeks hash dengan 50 term. Paket textrecipes serta pemisahan attrition_train dan attrition_test sudah dimuat.

Latihan ini merupakan bagian dari kursus

Rekayasa Fitur di R

Lihat Kursus

Instruksi latihan

  • Tambahkan sebuah langkah pada recipe yang menghasilkan indeks dummy_hash untuk EducationField.
  • Siapkan recipe tersebut.
  • Panggang (bake) recipe yang sudah disiapkan.
  • Gabungkan tabel recipe yang telah dipanggang dan nilai EducationField ke dalam satu tabel, lalu cetak 7 baris pertama, serta kolom ke-1 dan ke-18 hingga ke-20.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
  ___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)

# Prepare the recipe
object <- recipe %>%
  ___

# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)

# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]
Edit dan Jalankan Kode