MulaiMulai sekarang secara gratis

Replikasi bootstrap untuk statistik lain

Kita melihat pada latihan sebelumnya bahwa rerata berdistribusi Normal. Hal ini tidak selalu berlaku untuk statistik lainnya, tetapi jangan khawatir: sebagai hacker, kita selalu dapat mengambil replikasi bootstrap! Pada latihan ini, Anda akan menghasilkan replikasi bootstrap untuk varians curah hujan tahunan di Sheffield Weather Station dan memplot histogram dari replikasi tersebut.

Di sini, Anda akan menggunakan fungsi draw_bs_reps() yang Anda definisikan beberapa latihan yang lalu. Fungsinya disediakan di bawah ini sebagai referensi:

def draw_bs_reps(data, func, size=1):
    """Draw bootstrap replicates."""
    # Initialize array of replicates
    bs_replicates = np.empty(size)
    # Generate replicates
    for i in range(size):
        bs_replicates[i] = bootstrap_replicate_1d(data, func)
    return bs_replicates

Latihan ini adalah bagian dari kursus

Pemikiran Statistik dengan Python (Bagian 2)

Lihat Kursus

Petunjuk latihan

  • Gambar 10000 replikasi bootstrap dari varians curah hujan tahunan yang tersimpan dalam himpunan data rainfall, menggunakan fungsi draw_bs_reps() Anda. Petunjuk: Masukkan np.var untuk menghitung varians.
  • Bagi replikasi varians Anda (bs_replicates) dengan 100 agar varians dinyatakan dalam satuan sentimeter kuadrat demi kemudahan.
  • Buat histogram bs_replicates menggunakan argumen kata kunci normed=True dan 50 bin.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Generate 10,000 bootstrap replicates of the variance: bs_replicates
bs_replicates = ____

# Put the variance in units of square centimeters
____

# Make a histogram of the results
_ = plt.hist(____, ____, ____)
_ = plt.xlabel('variance of annual rainfall (sq. cm)')
_ = plt.ylabel('PDF')

# Show the plot
plt.show()
Edit dan Jalankan Kode