Bootstrap dağılımı oluşturma
Bir bootstrap dağılımı oluşturma süreci, bir örnekleme dağılımı oluşturma sürecine şaşırtıcı derecede benzer; yalnızca ilk adım farklıdır.
Bir örnekleme dağılımı yapmak için, ana kitleyle başlar ve yerine koymadan örnekleme yaparsın. Bir bootstrap dağılımı yapmak için ise, bir örnekle başlar ve onu yerine koyarak örnekler (resample) alırsın. Sonrasında adımlar aynı: ilgilendiğin özet istatistiği o örnek/yeniden örnek üzerinde hesapla ve bu süreci birçok kez tekrarla. Her iki durumda da dağılımı bir histogramla görselleştirebilirsin.
Burada, spotify_sample, spotify_population veri kümesinin bir alt kümesidir. Yeniden örneklemenin nasıl çalıştığını daha net görebilmek için bir satır kimliği (row ID) sütunu eklendi ve yalnızca sanatçı adı, şarkı adı ve danceability sütunları dahil edildi.
spotify_sample hazır; dplyr ve ggplot2 yüklü.
Bu egzersiz, kursun bir parçasıdır
R'de Örnekleme
Uygulamalı etkileşimli egzersiz
Bu egzersizi bu örnek kodu tamamlayarak deneyin.
# Generate 1 bootstrap resample
spotify_1_resample <- ___
# See the result
spotify_1_resample