Basit rasgele örnekleme
Bir ana kütleden örnekleme yapmanın en basit yöntemi, az önce gördüğündür. Buna, basit rasgele örnekleme (bazen kısaca "SRS" denir) adı verilir ve her satırın diğerleriyle aynı seçilme olasılığına sahip olduğu, satırların teker teker rasgele seçilmesini içerir.
Örneğe hangi satırların girdiğini daha rahat görebilmek için, örnek almadan önce veri kümesine bir satır kimliği (ID) sütunu eklemek faydalıdır.
Bu bölümde, IBM'den alınan sentetik (kurgusal) bir çalışan ayrılma veri kümesi üzerinde örnekleme yöntemlerine bakacağız; burada "attrition" şirketten ayrılmayı ifade eder.
attrition_pop hazır; dplyr yüklü.
Bu egzersiz
R'de Örnekleme
kursunun bir parçasıdırEgzersiz talimatları
attrition_popveri kümesini görüntüle. İçeriğini netleştirene kadar görüntüleyicide keşfet.- Rasgelelik tohumunu, seçtiğin bir değere ayarla.
- Veri kümesine bir satır ID sütunu ekle, sonra basit rasgele örnekleme ile 200 satır seç.
- Örnek veri kümesini,
attrition_samp'i görüntüle. Satır ID'leri hakkında ne fark ediyorsun?
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# View the attrition_pop dataset
___
# Set the seed
___
attrition_samp <- attrition_pop %>%
# Add a row ID column
___ %>%
# Get 200 rows using simple random sampling
___
# View the attrition_samp dataset
___