Çapraz doğrulama veri çerçeveleri

Verilerinin bir kısmını test verisi olarak ayırdığına göre, kalan kısmı en iyi performans gösteren modeli bulmak için kullanabilirsin.

Bu egzersizde, rsample paketindeki vfold_cv() fonksiyonunu kullanarak eğitim verisini 5 eğitim-doğrulama setine böleceksin.

Bu egzersiz, kursun bir parçasıdır

Tidyverse ile Machine Learning

Kursa Göz Atın

Egzersiz talimatları

training_data üzerinden vfold_cv() kullanarak 5 katlı çapraz doğrulama için bir veri çerçevesi oluştur ve cv_split değişkenine ata.
cv_datayı, cv_splite iki yeni sütun ekleyerek hazırla:
- train: splits sütunu boyunca training() fonksiyonunu eşleyerek eğitim veri çerçevelerini içeren sütun.
- validate: splits sütunu boyunca testing() fonksiyonunu eşleyerek doğrulama veri çerçevelerini içeren sütun.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

set.seed(42)

# Prepare the data frame containing the cross validation partitions
cv_split <- vfold_cv(___, v = ___)

cv_data <- cv_split %>% 
  mutate(
    # Extract the train data frame for each split
    train = map(___, ~___(.x)), 
    # Extract the validate data frame for each split
    validate = map(___, ~___(.x))
  )

# Use head() to preview cv_data
head(cv_data)

Kodu Düzenle ve Çalıştır