Menjalankan bootstrap sederhana
Selamat datang di latihan pertama dalam bagian bootstrapping. Kita akan membahas contoh untuk mempelajari cara menjalankan bootstrap sederhana. Seperti yang Anda lihat di video, gagasan utama di balik bootstrapping adalah pengambilan sampel dengan pengembalian (sampling with replacement).
Misalkan Anda memiliki pabrik yang memproduksi kunci inggris. Anda ingin mengukur panjang rata-rata kunci inggris dan memastikan bahwa panjang tersebut memenuhi spesifikasi tertentu. Pabrik Anda memproduksi ribuan kunci inggris setiap hari, tetapi tidak mungkin mengukur panjang setiap unit. Namun, Anda memiliki sampel representatif berisi 100 kunci inggris. Mari gunakan bootstrapping untuk mendapatkan interval kepercayaan (CI) 95% untuk panjang rata-ratanya.
Periksa daftar wrench_lengths, yang berisi 100 panjang kunci inggris yang teramati, di shell.
Latihan ini adalah bagian dari kursus
Simulasi Statistik di Python
Petunjuk latihan
- Ambil sampel acak dengan pengembalian dari
wrench_lengthsdan simpan dalamtemp_sample. Atursize = len(wrench_lengths). - Hitung panjang rata-rata setiap sampel, simpan ke
sample_mean, lalu tambahkan kemean_lengths. - Hitung mean hasil bootstrap (
boot_mean) dan interval kepercayaan 95% hasil bootstrap (boot_95_ci) menggunakannp.percentile().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Draw some random sample with replacement and append mean to mean_lengths.
mean_lengths, sims = [], 1000
for i in range(sims):
temp_sample = ____(____, replace=____, size=____)
sample_mean = ____
mean_lengths.append(sample_mean)
# Calculate bootstrapped mean and 95% confidence interval.
boot_mean = np.mean(____)
boot_95_ci = ____(mean_lengths, [2.5, 97.5])
print("Bootstrapped Mean Length = {}, 95% CI = {}".format(boot_mean, boot_95_ci))