%60/%40 bölmeyi dene
Videoda gördüğün gibi, bu bölümde Sonar veri kümesiyle çalışacaksın ve %60 eğitim, %40 test kümesi kullanacağız. Alıştırma olsun diye, eğitim/test bölmesini bir kez daha yapalım. Bir veri kümesindeki satır indekslerinin rastgele bir permütasyonunu elde etmek için sample() fonksiyonunu kullanabileceğini hatırla; bunu eğitim/test bölmeleri yaparken kullanırsın, örneğin:
n_obs <- nrow(my_data)
permuted_rows <- sample(n_obs)
Sonra bu satır indekslerini kullanarak veri kümesini rastgele yeniden sıralayabilirsin, örneğin:
my_data <- my_data[permuted_rows, ]
Veri kümen rastgele sıralandıktan sonra, ilk %60’ını eğitim kümesi, son %40’ını test kümesi olarak ayırabilirsin.
Bu egzersiz
R ile caret kullanarak Machine Learning
kursunun bir parçasıdırEgzersiz talimatları
Sonariçindeki gözlem (satır) sayısını al ven_obsdeğişkenine ata.Sonar’ın satır indekslerini karıştır ve sonucupermuted_rows’a kaydet.permuted_rows’u kullanarakSonarsatırlarını rastgele yeniden sırala veSonar_shuffledolarak kaydet.- %60/%40 bölme için hangi satırda bölüneceğini belirle. Bu satır numarasını
splitolarak sakla. Sonar_shuffled’ın ilk %60’ını eğitim kümesi olarak kaydet.Sonar_shuffled’ın son %40’ını test kümesi olarak kaydet.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Get the number of observations
# Shuffle row indices: permuted_rows
# Randomly order data: Sonar
# Identify row to split on: split
split <- round(n_obs * ___)
# Create train
# Create test