Membuat distribusi bootstrap
Proses untuk membuat distribusi bootstrap mirip dengan proses membuat distribusi sampel; hanya langkah pertama yang berbeda.
Untuk membuat distribusi sampel, Anda mulai dari populasi dan melakukan pengambilan sampel tanpa pengembalian. Untuk membuat distribusi bootstrap, Anda mulai dari sebuah sampel dan melakukan pengambilan sampel dari sampel tersebut dengan pengembalian. Setelah itu, langkah-langkahnya sama: hitung statistik ringkasan yang Anda minati pada sampel/ulang-sampel tersebut, lalu ulangi prosesnya berkali-kali. Pada masing-masing kasus, Anda dapat memvisualisasikan distribusinya dengan histogram.
Di sini, spotify_sample adalah subset dari himpunan data spotify_population. Untuk memudahkan melihat cara kerja penyampelan ulang, sebuah kolom indeks baris bernama 'index' telah ditambahkan, dan hanya kolom nama artis, nama lagu, serta danceability yang disertakan.
spotify_sample tersedia; pandas, numpy, dan matplotlib.pyplot telah dimuat dengan alias biasanya.
Latihan ini adalah bagian dari kursus
Sampling di Python
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Generate 1 bootstrap resample
spotify_1_resample = ____
# Print the resample
print(spotify_1_resample)