MulaiMulai sekarang secara gratis

Replikasi bootstrap dari rata-rata dan SEM

Dalam latihan ini, Anda akan menghitung estimasi bootstrap dari fungsi densitas peluang (PDF) untuk rata-rata curah hujan tahunan di Stasiun Cuaca Sheffield. Ingat, kita sedang memperkirakan rata-rata curah hujan tahunan yang akan kita peroleh jika Stasiun Cuaca Sheffield dapat mengulangi semua pengukuran dari 1883 hingga 2015 berkali-kali. Ini adalah estimasi probabilistik dari rata-ratanya. Anda akan memplot PDF sebagai histogram, dan Anda akan melihat bahwa distribusinya Normal.

Faktanya, dapat ditunjukkan secara teoretis bahwa dalam kondisi yang tidak terlalu ketat, nilai rata-rata akan selalu berdistribusi Normal. (Ini tidak berlaku secara umum, hanya untuk rata-rata dan beberapa statistik lainnya.) Simpangan baku dari distribusi ini, yang disebut standard error of the mean atau SEM, diberikan oleh simpangan baku data dibagi akar kuadrat dari jumlah titik data. Yakni, untuk suatu himpunan data, sem = np.std(data) / np.sqrt(len(data)). Dengan hacker statistics, Anda memperoleh hasil yang sama tanpa perlu menurunkannya, tetapi Anda akan memverifikasi hasil ini dari replikasi bootstrap Anda.

Himpunan data telah dimuat sebelumnya untuk Anda ke dalam array bernama rainfall.

Latihan ini adalah bagian dari kursus

Pemikiran Statistik dengan Python (Bagian 2)

Lihat Kursus

Petunjuk latihan

  • Gambar 10000 replikasi bootstrap dari rata-rata curah hujan tahunan menggunakan fungsi draw_bs_reps() Anda dan array rainfall. Petunjuk: Masukkan np.mean untuk func guna menghitung rata-rata.
    • Sebagai pengingat, draw_bs_reps() menerima 3 argumen: data, func, dan size.
  • Hitung dan cetak standard error of the mean dari rainfall.
    • Rumus perhitungannya adalah np.std(data) / np.sqrt(len(data)).
  • Hitung dan cetak simpangan baku dari replikasi bootstrap Anda bs_replicates.
  • Buat histogram dari replikasi tersebut menggunakan argumen kata kunci normed=True dan 50 bin.
  • Tekan submit untuk melihat plot!

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Take 10,000 bootstrap replicates of the mean: bs_replicates
bs_replicates = ____

# Compute and print SEM
sem = ____ / np.sqrt(____)
print(sem)

# Compute and print standard deviation of bootstrap replicates
bs_std = ____
print(bs_std)

# Make a histogram of the results
_ = plt.hist(____, ____=50, ____=True)
_ = plt.xlabel('mean annual rainfall (mm)')
_ = plt.ylabel('PDF')

# Show the plot
plt.show()
Edit dan Jalankan Kode