Memvisualisasikan sampel bootstrap
Dalam latihan ini, Anda akan membuat sampel bootstrap dari kumpulan data curah hujan tahunan yang diukur di Sheffield Weather Station di Inggris dari tahun 1883 hingga 2015. Data disimpan dalam array NumPy rainfall dalam satuan milimeter (mm). Dengan menampilkan sampel bootstrap secara grafis menggunakan ECDF, Anda dapat merasakan bagaimana pengambilan sampel bootstrap memungkinkan deskripsi probabilistik terhadap data.
Latihan ini adalah bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Petunjuk latihan
- Tulis loop
foruntuk memperoleh50sampel bootstrap dari data curah hujan dan plot ECDF-nya.- Gunakan
np.random.choice()untuk menghasilkan sampel bootstrap dari array NumPyrainfall. Pastikansizedari array hasil sampling ulang adalahlen(rainfall). - Gunakan fungsi
ecdf()yang Anda tulis pada prekuel kursus ini untuk menghasilkan nilaixdanyuntuk ECDF dari sampel bootstrapbs_sample. - Plot nilai ECDF. Tentukan
color='gray'(untuk membuat titik berwarna abu-abu) danalpha=0.1(agar semi-transparan, karena kita menumpuk banyak plot) selain argumen kata kuncimarker='.'danlinestyle='none'.
- Gunakan
- Gunakan
ecdf()untuk menghasilkan nilaixdanyuntuk ECDF dari data curah hujan asli yang tersedia dalam arrayrainfall. - Plot nilai ECDF dari data asli.
- Tekan Kirim untuk memvisualisasikan sampel!
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
for _ in range(50):
# Generate bootstrap sample: bs_sample
bs_sample = ____(____, size=____)
# Compute and plot ECDF from bootstrap sample
x, y = ____
_ = plt.plot(____, ____, ____='.', ____='none',
____='gray', ____=0.1)
# Compute and plot ECDF from original data
x, y = ____
_ = plt.plot(____, ____, ____='.')
# Make margins and label axes
plt.margins(0.02)
_ = plt.xlabel('yearly rainfall (mm)')
_ = plt.ylabel('ECDF')
# Show the plot
plt.show()