BaşlayınÜcretsiz başlayın

Matrise doğru

EducationField için altı farklı değer belirledin. Ama modeli yeni verilerde çalıştırırken başkalarının da ortaya çıkabileceğinden şüpheleniyorsun. Buna hazırlanmak için 50 terimli bir hash indeksi oluşturacaksın. textrecipes paketi ile attrition_train ve attrition_test ayrımları zaten yüklendi.

Bu egzersiz, kursun bir parçasıdır

R'da Feature Engineering

Kursa Göz Atın

Egzersiz talimatları

  • Tarife, EducationField için bir dummy_hash indeksi üreten bir adım ekle.
  • Tarifi hazırla.
  • Hazırlanmış tarifi pişir (bake).
  • Pişmiş tarif tablosunu ve EducationField değerlerini tek bir tabloda birleştir ve ilk 7 satırı, ayrıca 1. ve 18'den 20'ye kadar olan sütunları yazdır.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

recipe <- recipe(~EducationField, data = attrition_train) %>%
# Add a step to the recipe that generates a dummy_hash index for EducationField
  ___(EducationField, prefix = NULL, signed = FALSE, num_terms = 50L)

# Prepare the recipe
object <- recipe %>%
  ___

# Bake the prepped recipe
baked <- ___(object, new_data = attrition_test)

# Bind the baked recipe table and the EducationField values into one table
bind_cols(___, baked)[1:7,c(1,18:20)]
Kodu Düzenle ve Çalıştır