MulaiMulai sekarang secara gratis

Distribusi sampling vs. distribusi bootstrap

Distribusi sampling dan distribusi bootstrap sangat berkaitan. Dalam situasi ketika Anda dapat melakukan pengambilan sampel berulang kali dari suatu populasi (kesempatan ini jarang terjadi) dan saat Anda mempelajari keduanya, akan membantu untuk membangkitkan distribusi sampling dan distribusi bootstrap secara berurutan untuk melihat keterkaitannya.

Di sini, statistik yang Anda minati adalah rataan skor popularity dari lagu-lagu.

spotify_population (seluruh himpunan data) dan spotify_sample (hanya 500 baris yang merepresentasikan sampel awal) tersedia; dplyr sudah dimuat.

Latihan ini adalah bagian dari kursus

Sampling di R

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Generate a sampling distribution
mean_popularity_2000_samp <- ___(
  # Use 2000 replicates
  ___,
  expr = {
    # Start with the population
    ___ %>% 
      # Sample 500 rows without replacement
      ___ %>% 
      # Calculate the mean popularity as mean_popularity
      ___ %>% 
      # Pull out the mean popularity
      ___
  }
)

# See the result
mean_popularity_2000_samp
Edit dan Jalankan Kode