MulaiMulai sekarang secara gratis

Estimator non-standar

Pada latihan sebelumnya, Anda menjalankan bootstrap sederhana yang sekarang akan kita modifikasi untuk estimator yang lebih kompleks.

Misalkan Anda meneliti kesehatan mahasiswa. Anda diberi tinggi badan dan berat badan 1000 mahasiswa dan tertarik pada median tinggi badan serta korelasi antara tinggi dan berat, beserta IK 95% untuk kedua besaran tersebut. Mari gunakan bootstrapping.

Periksa pandas DataFrame df yang berisi tinggi dan berat 1000 mahasiswa. Dengan ini, hitung IK 95% untuk median tinggi badan serta korelasi antara tinggi dan berat.

Latihan ini adalah bagian dari kursus

Simulasi Statistik di Python

Lihat Kursus

Petunjuk latihan

  • Gunakan metode .sample() pada df untuk menghasilkan sampel data dengan pengembalian dan tetapkan ke tmp_df.
  • Untuk setiap himpunan data yang dihasilkan di tmp_df, hitung median tinggi dan korelasi antara tinggi dan berat menggunakan .median() dan .corr().
  • Tambahkan median tinggi ke height_medians dan korelasi ke hw_corr.
  • Terakhir, hitung interval kepercayaan 95% ([2.5, 97.5]) untuk masing-masing besaran di atas menggunakan np.percentile().

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Sample with replacement and calculate quantities of interest
sims, data_size, height_medians, hw_corr = 1000, df.shape[0], [], []
for i in range(sims):
    tmp_df = ____(n=____, replace=____)
    height_medians.append(____)
    hw_corr.append(____)

# Calculate confidence intervals
height_median_ci = np.____
height_weight_corr_ci = np.____
print("Height Median CI = {} \nHeight Weight Correlation CI = {}".format( height_median_ci, height_weight_corr_ci))
Edit dan Jalankan Kode