Distribusi sampling vs. distribusi bootstrap
Distribusi sampling dan distribusi bootstrap sangat berkaitan. Dalam situasi ketika Anda dapat melakukan pengambilan sampel berulang kali dari suatu populasi (kesempatan ini jarang terjadi) dan saat Anda mempelajari keduanya, akan membantu untuk membangkitkan distribusi sampling dan distribusi bootstrap secara berurutan untuk melihat keterkaitannya.
Di sini, statistik yang Anda minati adalah rataan skor popularity dari lagu-lagu.
spotify_population (seluruh himpunan data) dan spotify_sample (hanya 500 baris yang merepresentasikan sampel awal) tersedia; dplyr sudah dimuat.
Latihan ini adalah bagian dari kursus
Sampling di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
# Use 2000 replicates
___,
expr = {
# Start with the population
___ %>%
# Sample 500 rows without replacement
___ %>%
# Calculate the mean popularity as mean_popularity
___ %>%
# Pull out the mean popularity
___
}
)
# See the result
mean_popularity_2000_samp