Bootstrap dağılımı oluşturma
Bir bootstrap dağılımı oluşturma süreci, bir örnekleme dağılımı oluşturma sürecine şaşırtıcı derecede benzer; yalnızca ilk adım farklıdır.
Bir örnekleme dağılımı yapmak için, ana kitleyle başlar ve yerine koymadan örnekleme yaparsın. Bir bootstrap dağılımı yapmak için ise, bir örnekle başlar ve onu yerine koyarak örnekler (resample) alırsın. Sonrasında adımlar aynı: ilgilendiğin özet istatistiği o örnek/yeniden örnek üzerinde hesapla ve bu süreci birçok kez tekrarla. Her iki durumda da dağılımı bir histogramla görselleştirebilirsin.
Burada, spotify_sample, spotify_population veri kümesinin bir alt kümesidir. Yeniden örneklemenin nasıl çalıştığını daha net görebilmek için bir satır kimliği (row ID) sütunu eklendi ve yalnızca sanatçı adı, şarkı adı ve danceability sütunları dahil edildi.
spotify_sample hazır; dplyr ve ggplot2 yüklü.
Bu egzersiz
R'de Örnekleme
kursunun bir parçasıdırUygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Generate 1 bootstrap resample
spotify_1_resample <- ___
# See the result
spotify_1_resample