Doğrulama seti yaklaşımı
Doğrusal regresyon bölümünde, kedilerin kalp ağırlıklarını beden ağırlıklarıyla açıklayan bir doğrusal regresyon modeli kurmuştun. İş görüşmecisi senden modelinin ne kadar iyi olduğunu değerlendirmeni istiyor.
Bu soruyu yanıtlamak için, gerçek değerlerle karşılaştırabileceğin tahminler üretmen gerekiyor. Doğrulama seti yaklaşımında, verini iki parçaya ayırırsın.
Bunu yapmak için önce, örneğin satır numaralarının %80’ini örnekleme yoluyla seçebilirsin. Seçtiğin satır numaralarını eğitim kümesini alt kümelemek için kullan. Kalan veri çerçevesini ise test için kullanabilirsin.

Unutma ki:
rows <- c(1, 3)
df[-rows, ]
ilk ve üçüncü satır hariç tümünü alt kümeler.
cats veri kümesi çalışma ortamında mevcut.
Bu egzersiz, kursun bir parçasıdır
R ile İstatistik Mülakat Soruları Pratiği
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
set.seed(123)
# Generate train row numbers
train_rows <- ___(nrow(___), round(0.8 * ___(cats)))