Eğitim ve test setlerini ayır
Bir modeli eğitmenin ilk adımı, veriyi eğitim ve test setlerine bölmektir. tidymodels paketi bunu kolaylaştırır. Bir test veri setini kenara ayırmak, eğitilen modeli daha önce hiç görmediği bir veri üzerinde değerlendirmeni sağlar.
Bir sağlık şirketinin çalışanlarına ait bilgileri ve şirketten ayrılıp ayrılmadıklarını içeren çalışan sağlık çalışan devir (attrition) verisini kullanacaksın. Veri attrition_df içinde mevcut. Hedef değişken Attrition.
tidyverse ve tidymodels paketleri senin için yüklendi.
Bu egzersiz, kursun bir parçasıdır
R'de Boyutsal Azaltma
Egzersiz talimatları
- Veriyi %80'i eğitim için olacak şekilde, hedef değişken olan
Attrition'a göre tabakalandırarak (stratify) bir bölme başlat. - Eğitim veri setini çıkar ve
trainiçinde sakla. - Test veri setini çıkar ve
testiçinde sakla.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Initialize the split
split <- ___(___, ___ = ___, strata = ___)
# Extract training set
train <- ___ %>% ___()
# Extract testing set
test <- ___ %>% ___()