Katmanları oluştur
Veriyi yalnızca bir kez eğitim ve test kümelerine ayırmak istatistiksel belirsizlikler içerir — küçük de olsa, test kümenin sadece yüksek puanlı taneleri içerirken düşük puanlıların hepsinin eğitim kümesinde kalma olasılığı vardır. Bu ayrıca, modelinin performansını yalnızca bir kez ölçebileceğin anlamına gelir.
Çapraz doğrulama, istatistiksel tuzaklara düşmeden, örneklem dışı performansının daha sağlam bir tahminini verir — modelini daha kapsamlı değerlendirir.
Bu egzersizde, önceden yüklenmiş olan eğitim verin chocolate_train için katmanlar oluşturacaksın.
Bu egzersiz
R ile Ağaç Tabanlı Modellerle Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
- Tekrarlanabilirlik için tohumu 20 olarak ayarla.
chocolate_trainiçin 10 katman oluştur ve sonucuchocolate_foldsolarak kaydet.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Set seed for reproducibility
___
# Build 10 folds
chocolate_folds <- ___(___, v = ___)
print(chocolate_folds)