Katmanları oluştur
Veriyi yalnızca bir kez eğitim ve test kümelerine ayırmak istatistiksel belirsizlikler içerir — küçük de olsa, test kümenin sadece yüksek puanlı taneleri içerirken düşük puanlıların hepsinin eğitim kümesinde kalma olasılığı vardır. Bu ayrıca, modelinin performansını yalnızca bir kez ölçebileceğin anlamına gelir.
Çapraz doğrulama, istatistiksel tuzaklara düşmeden, örneklem dışı performansının daha sağlam bir tahminini verir — modelini daha kapsamlı değerlendirir.
Bu egzersizde, önceden yüklenmiş olan eğitim verin chocolate_train için katmanlar oluşturacaksın.
Bu egzersiz, kursun bir parçasıdır
R ile Ağaç Tabanlı Modellerle Machine Learning
Egzersiz talimatları
- Tekrarlanabilirlik için tohumu 20 olarak ayarla.
chocolate_trainiçin 10 katman oluştur ve sonucuchocolate_foldsolarak kaydet.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Set seed for reproducibility
___
# Build 10 folds
chocolate_folds <- ___(___, v = ___)
print(chocolate_folds)