Distribusi sampling vs. distribusi bootstrap
Distribusi sampling dan distribusi bootstrap memiliki keterkaitan yang erat. Dalam situasi saat Anda dapat berulang kali mengambil sampel dari suatu populasi (kesempatan ini jarang), akan berguna untuk membuat baik distribusi sampling maupun distribusi bootstrap, secara berurutan, untuk melihat bagaimana keduanya saling terkait.
Di sini, statistik yang Anda minati adalah nilai rata-rata popularity lagu.
spotify_population (seluruh himpunan data) dan spotify_sample (500 baris yang diambil secara acak dari spotify_population) tersedia; pandas dan numpy telah dimuat dengan alias biasanya.
Latihan ini adalah bagian dari kursus
Sampling di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
mean_popularity_2000_samp = []
# Generate a sampling distribution of 2000 replicates
____:
mean_popularity_2000_samp.append(
# Sample 500 rows and calculate the mean popularity
____
)
# Print the sampling distribution results
print(mean_popularity_2000_samp)