Doğrulama seti yaklaşımı
Doğrusal regresyon bölümünde, kedilerin kalp ağırlıklarını beden ağırlıklarıyla açıklayan bir doğrusal regresyon modeli kurmuştun. İş görüşmecisi senden modelinin ne kadar iyi olduğunu değerlendirmeni istiyor.
Bu soruyu yanıtlamak için, gerçek değerlerle karşılaştırabileceğin tahminler üretmen gerekiyor. Doğrulama seti yaklaşımında, verini iki parçaya ayırırsın.
Bunu yapmak için önce, örneğin satır numaralarının %80’ini örnekleme yoluyla seçebilirsin. Seçtiğin satır numaralarını eğitim kümesini alt kümelemek için kullan. Kalan veri çerçevesini ise test için kullanabilirsin.

Unutma ki:
rows <- c(1, 3)
df[-rows, ]
ilk ve üçüncü satır hariç tümünü alt kümeler.
cats veri kümesi çalışma ortamında mevcut.
Bu egzersiz
R ile İstatistik Mülakat Soruları Pratiği
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
set.seed(123)
# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))