Uji hipotesis bootstrap dua-sampel untuk selisih rata-rata
Sekarang kita ingin menguji hipotesis bahwa Katak A dan Katak B memiliki rata-rata gaya tumbukan yang sama, tetapi tidak harus memiliki sebaran yang sama, yang juga mustahil diuji dengan uji permutasi.
Untuk melakukan uji bootstrap dua-sampel, kita menggeser kedua array agar memiliki rata-rata yang sama, karena kita sedang mensimulasikan hipotesis bahwa rata-rata keduanya memang sama. Kemudian kita mengambil sampel bootstrap dari array yang sudah digeser dan menghitung selisih rata-ratanya. Ini merupakan satu replikasi bootstrap, dan kita menghasilkan banyak replikasi. Nilai p (p-value) adalah fraksi replikasi dengan selisih rata-rata yang lebih besar atau sama dengan yang teramati.
Objek forces_concat dan empirical_diff_means sudah tersedia di namespace Anda.
Latihan ini adalah bagian dari kursus
Pemikiran Statistik dengan Python (Bagian 2)
Petunjuk latihan
- Hitung rata-rata semua gaya (dari
forces_concat) menggunakannp.mean(). - Hasilkan himpunan data yang telah digeser untuk baik
force_amaupunforce_bsehingga rata-rata masing-masing sama dengan rata-rata dari array gabungan gaya tumbukan. - Hasilkan 10.000 replikasi bootstrap dari rata-rata untuk masing-masing dari dua array yang telah digeser.
- Hitung replikasi bootstrap dari selisih rata-rata dengan mengurangkan replikasi gaya tumbukan yang telah digeser milik Katak B dari milik Katak A.
- Hitung dan cetak p-value dari replikasi bootstrap Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute mean of all forces: mean_force
mean_force = ____
# Generate shifted arrays
force_a_shifted = force_a - np.mean(force_a) + mean_force
force_b_shifted = ____
# Compute 10,000 bootstrap replicates from shifted arrays
bs_replicates_a = draw_bs_reps(____, ____, ____)
bs_replicates_b = draw_bs_reps(____, ____, ____)
# Get replicates of difference of means: bs_replicates
bs_replicates = ____
# Compute and print p-value: p
p = ____ / ____
print('p-value =', p)