BaşlayınÜcretsiz Başlayın

Çapraz doğrulama veri çerçeveleri

Verilerinin bir kısmını test verisi olarak ayırdığına göre, kalan kısmı en iyi performans gösteren modeli bulmak için kullanabilirsin.

Bu egzersizde, rsample paketindeki vfold_cv() fonksiyonunu kullanarak eğitim verisini 5 eğitim-doğrulama setine böleceksin.

Bu egzersiz

Tidyverse ile Machine Learning

kursunun bir parçasıdır
Kursu Görüntüle

Egzersiz talimatları

  • training_data üzerinden vfold_cv() kullanarak 5 katlı çapraz doğrulama için bir veri çerçevesi oluştur ve cv_split değişkenine ata.
  • cv_datayı, cv_splite iki yeni sütun ekleyerek hazırla:
    • train: splits sütunu boyunca training() fonksiyonunu eşleyerek eğitim veri çerçevelerini içeren sütun.
    • validate: splits sütunu boyunca testing() fonksiyonunu eşleyerek doğrulama veri çerçevelerini içeren sütun.

Uygulamalı interaktif egzersiz

Bu örnek kodu tamamlayarak bu egzersizi bitirin.

set.seed(42)

# Prepare the data frame containing the cross validation partitions
cv_split <- vfold_cv(___, v = ___)

cv_data <- cv_split %>% 
  mutate(
    # Extract the train data frame for each split
    train = map(___, ~___(.x)), 
    # Extract the validate data frame for each split
    validate = map(___, ~___(.x))
  )

# Use head() to preview cv_data
head(cv_data)
Kodu Düzenle ve Çalıştır