Matrise doğru
EducationField için altı farklı değer belirledin. Ama modeli yeni verilerde çalıştırırken başkalarının da ortaya çıkabileceğinden şüpheleniyorsun. Buna hazırlanmak için 50 terimli bir hash indeksi oluşturacaksın. textrecipes paketi ile attrition_train ve attrition_test ayrımları zaten yüklendi.
Bu egzersiz
R'da Feature Engineering
kursunun bir parçasıdırEgzersiz talimatları
- Tarife,
EducationFieldiçin bir dummy_hash indeksi üreten bir adım ekle. - Tarifi hazırla.
- Hazırlanmış tarifi pişir (bake).
- Pişmiş tarif tablosunu ve
EducationFielddeğerlerini tek bir tabloda birleştir ve ilk 7 satırı, ayrıca 1. ve 18'den 20'ye kadar olan sütunları yazdır.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)
# Prepare the recipe
object <- recipe %>%
___
# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)
# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]