Çapraz doğrulama veri çerçeveleri
Verilerinin bir kısmını test verisi olarak ayırdığına göre, kalan kısmı en iyi performans gösteren modeli bulmak için kullanabilirsin.
Bu egzersizde, rsample paketindeki vfold_cv() fonksiyonunu kullanarak eğitim verisini 5 eğitim-doğrulama setine böleceksin.
Bu egzersiz
Tidyverse ile Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
training_dataüzerindenvfold_cv()kullanarak 5 katlı çapraz doğrulama için bir veri çerçevesi oluştur vecv_splitdeğişkenine ata.cv_datayı,cv_splite iki yeni sütun ekleyerek hazırla:train:splitssütunu boyuncatraining()fonksiyonunu eşleyerek eğitim veri çerçevelerini içeren sütun.validate:splitssütunu boyuncatesting()fonksiyonunu eşleyerek doğrulama veri çerçevelerini içeren sütun.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
set.seed(42)
# Prepare the data frame containing the cross validation partitions
cv_split <- vfold_cv(___, v = ___)
cv_data <- cv_split %>%
mutate(
# Extract the train data frame for each split
train = map(___, ~___(.x)),
# Extract the validate data frame for each split
validate = map(___, ~___(.x))
)
# Use head() to preview cv_data
head(cv_data)