%80/%20 bölmeyi dene
Artık veri kümen rastgele sıralandığına göre, ilk %80’ini bir eğitim kümesine, son %20’sini ise bir test kümesine ayırabilirsin. Bunu, verilerinin yaklaşık %80’ine denk gelen bir bölme noktası seçerek yapabilirsin:
split <- round(nrow(mydata) * 0.80)
Sonra bu noktayı kullanarak veri kümesinin ilk %80’ini eğitim kümesi olarak ayırabilirsin:
mydata[1:split, ]
Aynı noktayı kullanarak test kümesini de belirleyebilirsin:
mydata[(split + 1):nrow(mydata), ]
Bu egzersiz, kursun bir parçasıdır
R ile caret kullanarak Machine Learning
Egzersiz talimatları
diamondsveri kümesinin yaklaşık %80’ine denk gelecek şekilde bölme yapılacak bir satır indeksi seç. Bu indeksin adısplitolsun.- Bu indeksi kullanarak
trainadlı bir eğitim kümesi oluştur. - Bu indeksi kullanarak
testadlı bir test kümesi oluştur.
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Determine row to split on: split
# Create train
# Create test