Replikasi bootstrap untuk statistik lain
Kita melihat pada latihan sebelumnya bahwa rerata berdistribusi Normal. Hal ini tidak selalu berlaku untuk statistik lainnya, tetapi jangan khawatir: sebagai hacker, kita selalu dapat mengambil replikasi bootstrap! Pada latihan ini, Anda akan menghasilkan replikasi bootstrap untuk varians curah hujan tahunan di Sheffield Weather Station dan memplot histogram dari replikasi tersebut.
Di sini, Anda akan menggunakan fungsi draw_bs_reps() yang Anda definisikan beberapa latihan yang lalu. Fungsinya disediakan di bawah ini sebagai referensi:
def draw_bs_reps(data, func, size=1):
"""Draw bootstrap replicates."""
# Initialize array of replicates
bs_replicates = np.empty(size)
# Generate replicates
for i in range(size):
bs_replicates[i] = bootstrap_replicate_1d(data, func)
return bs_replicates
Latihan ini adalah bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Petunjuk latihan
- Gambar
10000replikasi bootstrap dari varians curah hujan tahunan yang tersimpan dalam himpunan datarainfall, menggunakan fungsidraw_bs_reps()Anda. Petunjuk: Masukkannp.varuntuk menghitung varians. - Bagi replikasi varians Anda (
bs_replicates) dengan100agar varians dinyatakan dalam satuan sentimeter kuadrat demi kemudahan. - Buat histogram
bs_replicatesmenggunakan argumen kata kuncinormed=Truedan50bin.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____
# Put the variance in units of square centimeters
____
# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()