Eğitim ve test setlerini ayır
Bir modeli eğitmenin ilk adımı, veriyi eğitim ve test setlerine bölmektir. tidymodels paketi bunu kolaylaştırır. Bir test veri setini kenara ayırmak, eğitilen modeli daha önce hiç görmediği bir veri üzerinde değerlendirmeni sağlar.
Bir sağlık şirketinin çalışanlarına ait bilgileri ve şirketten ayrılıp ayrılmadıklarını içeren çalışan sağlık çalışan devir (attrition) verisini kullanacaksın. Veri attrition_df içinde mevcut. Hedef değişken Attrition.
tidyverse ve tidymodels paketleri senin için yüklendi.
Bu egzersiz
R'de Boyutsal Azaltma
kursunun bir parçasıdırEgzersiz talimatları
- Veriyi %80'i eğitim için olacak şekilde, hedef değişken olan
Attrition'a göre tabakalandırarak (stratify) bir bölme başlat. - Eğitim veri setini çıkar ve
trainiçinde sakla. - Test veri setini çıkar ve
testiçinde sakla.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Initialize the split
split <- ___(___, ___ = ___, strata = ___)
# Extract training set
train <- ___ %>% ___()
# Extract testing set
test <- ___ %>% ___()