Estimator non-standar
Pada latihan sebelumnya, Anda menjalankan bootstrap sederhana yang sekarang akan kita modifikasi untuk estimator yang lebih kompleks.
Misalkan Anda meneliti kesehatan mahasiswa. Anda diberi tinggi badan dan berat badan 1000 mahasiswa dan tertarik pada median tinggi badan serta korelasi antara tinggi dan berat, beserta IK 95% untuk kedua besaran tersebut. Mari gunakan bootstrapping.
Periksa pandas DataFrame df yang berisi tinggi dan berat 1000 mahasiswa. Dengan ini, hitung IK 95% untuk median tinggi badan serta korelasi antara tinggi dan berat.
Latihan ini adalah bagian dari kursus
Simulasi Statistik di Python
Petunjuk latihan
- Gunakan metode
.sample()padadfuntuk menghasilkan sampel data dengan pengembalian dan tetapkan ketmp_df. - Untuk setiap himpunan data yang dihasilkan di
tmp_df, hitung median tinggi dan korelasi antara tinggi dan berat menggunakan.median()dan.corr(). - Tambahkan median tinggi ke
height_mediansdan korelasi kehw_corr. - Terakhir, hitung interval kepercayaan 95% (
[2.5, 97.5]) untuk masing-masing besaran di atas menggunakannp.percentile().
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Sample with replacement and calculate quantities of interest
sims, data_size, height_medians, hw_corr = 1000, df.shape[0], [], []
for i in range(sims):
tmp_df = ____(n=____, replace=____)
height_medians.append(____)
hw_corr.append(____)
# Calculate confidence intervals
height_median_ci = np.____
height_weight_corr_ci = np.____
print("Height Median CI = {} \nHeight Weight Correlation CI = {}".format( height_median_ci, height_weight_corr_ci))