Membuat distribusi bootstrap
Proses untuk membuat distribusi bootstrap sangat mirip dengan proses membuat distribusi sampling; hanya langkah pertama yang berbeda.
Untuk membuat distribusi sampling, Anda mulai dari populasi dan melakukan sampling tanpa pengembalian. Untuk membuat distribusi bootstrap, Anda mulai dari sebuah sampel dan melakukan sampling dengan pengembalian terhadap sampel tersebut. Setelah itu, langkah-langkahnya sama: hitung statistik ringkasan yang Anda minati pada sampel/ulang-sampel tersebut, lalu replikasi prosesnya berkali-kali. Dalam kedua kasus, Anda dapat memvisualisasikan distribusinya dengan histogram.
Di sini, spotify_sample adalah subset dari himpunan data spotify_population. Agar lebih mudah melihat cara kerja pengambilan sampel ulang, kolom ID baris telah ditambahkan, dan hanya kolom nama artis, nama lagu, dan danceability yang disertakan.
spotify_sample tersedia; dplyr dan ggplot2 sudah dimuat.
Latihan ini adalah bagian dari kursus
Sampling di R
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Generate 1 bootstrap resample
spotify_1_resample <- ___
# See the result
spotify_1_resample