%60/%40 bölmeyi dene

Videoda gördüğün gibi, bu bölümde Sonar veri kümesiyle çalışacaksın ve %60 eğitim, %40 test kümesi kullanacağız. Alıştırma olsun diye, eğitim/test bölmesini bir kez daha yapalım. Bir veri kümesindeki satır indekslerinin rastgele bir permütasyonunu elde etmek için sample() fonksiyonunu kullanabileceğini hatırla; bunu eğitim/test bölmeleri yaparken kullanırsın, örneğin:

n_obs <- nrow(my_data)
permuted_rows <- sample(n_obs)

Sonra bu satır indekslerini kullanarak veri kümesini rastgele yeniden sıralayabilirsin, örneğin:

my_data <- my_data[permuted_rows, ]

Veri kümen rastgele sıralandıktan sonra, ilk %60’ını eğitim kümesi, son %40’ını test kümesi olarak ayırabilirsin.

Bu egzersiz, kursun bir parçasıdır

R ile caret kullanarak Machine Learning

Kursa Göz Atın

Egzersiz talimatları

Sonar içindeki gözlem (satır) sayısını al ve n_obs değişkenine ata.
Sonar’ın satır indekslerini karıştır ve sonucu permuted_rows’a kaydet.
permuted_rows’u kullanarak Sonar satırlarını rastgele yeniden sırala ve Sonar_shuffled olarak kaydet.
%60/%40 bölme için hangi satırda bölüneceğini belirle. Bu satır numarasını split olarak sakla.
Sonar_shuffled’ın ilk %60’ını eğitim kümesi olarak kaydet.
Sonar_shuffled’ın son %40’ını test kümesi olarak kaydet.

Uygulamalı etkileşimli egzersiz

Bu egzersizi bu örnek kodu tamamlayarak deneyin.

# Get the number of observations


# Shuffle row indices: permuted_rows


# Randomly order data: Sonar


# Identify row to split on: split
split <- round(n_obs * ___)

# Create train


# Create test

Kodu Düzenle ve Çalıştır