Masuk ke matriks
Anda telah mengidentifikasi enam nilai berbeda untuk EducationField. Namun, Anda menduga bahwa nilai lain mungkin muncul saat Anda menjalankan model pada data baru. Untuk mengantisipasi hal ini, Anda akan membuat indeks hash dengan 50 term. Paket textrecipes serta pemisahan attrition_train dan attrition_test sudah dimuat.
Latihan ini merupakan bagian dari kursus
Rekayasa Fitur di R
Instruksi latihan
- Tambahkan sebuah langkah pada recipe yang menghasilkan indeks dummy_hash untuk
EducationField. - Siapkan recipe tersebut.
- Panggang (bake) recipe yang sudah disiapkan.
- Gabungkan tabel recipe yang telah dipanggang dan nilai
EducationFieldke dalam satu tabel, lalu cetak 7 baris pertama, serta kolom ke-1 dan ke-18 hingga ke-20.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)
# Prepare the recipe
object <- recipe %>%
___
# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)
# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]