%80/%20 bölmeyi dene
Artık veri kümen rastgele sıralandığına göre, ilk %80’ini bir eğitim kümesine, son %20’sini ise bir test kümesine ayırabilirsin. Bunu, verilerinin yaklaşık %80’ine denk gelen bir bölme noktası seçerek yapabilirsin:
split <- round(nrow(mydata) * 0.80)
Sonra bu noktayı kullanarak veri kümesinin ilk %80’ini eğitim kümesi olarak ayırabilirsin:
mydata[1:split, ]
Aynı noktayı kullanarak test kümesini de belirleyebilirsin:
mydata[(split + 1):nrow(mydata), ]
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
diamondsveri kümesinin yaklaşık %80’ine denk gelecek şekilde bölme yapılacak bir satır indeksi seç. Bu indeksin adısplitolsun.- Bu indeksi kullanarak
trainadlı bir eğitim kümesi oluştur. - Bu indeksi kullanarak
testadlı bir test kümesi oluştur.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Determine row to split on: split
# Create train
# Create test