Replikasi bootstrap untuk statistik lain
Kita melihat pada latihan sebelumnya bahwa rerata berdistribusi Normal. Hal ini tidak selalu berlaku untuk statistik lainnya, tetapi jangan khawatir: sebagai hacker, kita selalu dapat mengambil replikasi bootstrap! Pada latihan ini, Anda akan menghasilkan replikasi bootstrap untuk varians curah hujan tahunan di Sheffield Weather Station dan memplot histogram dari replikasi tersebut.
Di sini, Anda akan menggunakan fungsi draw_bs_reps() yang Anda definisikan beberapa latihan yang lalu. Fungsinya disediakan di bawah ini sebagai referensi:
def draw_bs_reps(data, func, size=1):
"""Draw bootstrap replicates."""
# Initialize array of replicates
bs_replicates = np.empty(size)
# Generate replicates
for i in range(size):
bs_replicates[i] = bootstrap_replicate_1d(data, func)
return bs_replicates
Latihan ini merupakan bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Instruksi latihan
- Gambar
10000replikasi bootstrap dari varians curah hujan tahunan yang tersimpan dalam himpunan datarainfall, menggunakan fungsidraw_bs_reps()Anda. Petunjuk: Masukkannp.varuntuk menghitung varians. - Bagi replikasi varians Anda (
bs_replicates) dengan100agar varians dinyatakan dalam satuan sentimeter kuadrat demi kemudahan. - Buat histogram
bs_replicatesmenggunakan argumen kata kuncinormed=Truedan50bin.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____
# Put the variance in units of square centimeters
____
# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')
# Show the plot
plt.show()