Replikasi bootstrap dari rata-rata dan SEM
Dalam latihan ini, Anda akan menghitung estimasi bootstrap dari fungsi densitas peluang (PDF) untuk rata-rata curah hujan tahunan di Stasiun Cuaca Sheffield. Ingat, kita sedang memperkirakan rata-rata curah hujan tahunan yang akan kita peroleh jika Stasiun Cuaca Sheffield dapat mengulangi semua pengukuran dari 1883 hingga 2015 berkali-kali. Ini adalah estimasi probabilistik dari rata-ratanya. Anda akan memplot PDF sebagai histogram, dan Anda akan melihat bahwa distribusinya Normal.
Faktanya, dapat ditunjukkan secara teoretis bahwa dalam kondisi yang tidak terlalu ketat, nilai rata-rata akan selalu berdistribusi Normal. (Ini tidak berlaku secara umum, hanya untuk rata-rata dan beberapa statistik lainnya.) Simpangan baku dari distribusi ini, yang disebut standard error of the mean atau SEM, diberikan oleh simpangan baku data dibagi akar kuadrat dari jumlah titik data. Yakni, untuk suatu himpunan data, sem = np.std(data) / np.sqrt(len(data)). Dengan hacker statistics, Anda memperoleh hasil yang sama tanpa perlu menurunkannya, tetapi Anda akan memverifikasi hasil ini dari replikasi bootstrap Anda.
Himpunan data telah dimuat sebelumnya untuk Anda ke dalam array bernama rainfall.
Latihan ini adalah bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Petunjuk latihan
- Gambar
10000replikasi bootstrap dari rata-rata curah hujan tahunan menggunakan fungsidraw_bs_reps()Anda dan arrayrainfall. Petunjuk: Masukkannp.meanuntukfuncguna menghitung rata-rata.- Sebagai pengingat,
draw_bs_reps()menerima 3 argumen:data,func, dansize.
- Sebagai pengingat,
- Hitung dan cetak standard error of the mean dari
rainfall.- Rumus perhitungannya adalah
np.std(data) / np.sqrt(len(data)).
- Rumus perhitungannya adalah
- Hitung dan cetak simpangan baku dari replikasi bootstrap Anda
bs_replicates. - Buat histogram dari replikasi tersebut menggunakan argumen kata kunci
normed=Truedan50bin. - Tekan submit untuk melihat plot!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Take 10,000 bootstrap replicates of the mean: bs_replicates
bs_replicates = ____
# Compute and print SEM
sem = ____ / np.sqrt(____)
print(sem)
# Compute and print standard deviation of bootstrap replicates
bs_std = ____
print(bs_std)
# Make a histogram of the results
_ = plt.hist(____, ____=50, ____=True)
_ = plt.xlabel('mean annual rainfall (mm)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()