Uji hipotesis bootstrap
Uji permutasi memiliki hipotesis yang cukup ketat, yaitu bahwa panjang bout heterozigot dan tipe liar berdistribusi identik. Sekarang, gunakan uji hipotesis bootstrap untuk menguji hipotesis bahwa rataan keduanya sama, tanpa membuat asumsi tentang distribusinya.
Latihan ini adalah bagian dari kursus
Studi Kasus dalam Pemikiran Statistik
Petunjuk latihan
- Buat array
bout_lengths_concatyang berisi semua panjang bout untuk tipe liar (bout_lengths_wt) dan heterozigot (bout_lengths_het) menggunakannp.concatenate(). - Hitung rata-rata semua panjang bout dari array gabungan (
bout_lengths_concat), simpan hasilnya dalam variabelmean_bout_length. - Geser kedua himpunan data sehingga keduanya memiliki rataan yang sama, yaitu
mean_bout_length. Simpan array yang sudah digeser dalam variabelwt_shifteddanhet_shifted. - Gunakan
dcst.draw_bs_reps()untuk mengambil 10.000 replikasi bootstrap dari rataan untuk masing-masing himpunan data yang sudah digeser. Simpan replikasi tersebut masing-masing dalambs_reps_wtdanbs_reps_het. - Kurangkan
bs_reps_wtdaribs_reps_hetuntuk memperoleh replikasi bootstrap dari selisih rataan. Simpan hasilnya dalam variabelbs_reps. - Hitung p-value, dengan mendefinisikan "setidaknya sebesar ini" sebagai selisih rataan di bawah hipotesis nol yang lebih besar daripada atau sama dengan yang diamati secara eksperimen. Variabel
diff_means_expdari latihan sebelumnya sudah tersedia dalam ruang nama Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Concatenate arrays: bout_lengths_concat
bout_lengths_concat = ____((____, ____))
# Compute mean of all bout_lengths: mean_bout_length
mean_bout_length = ____
# Generate shifted arrays
wt_shifted = ____ - np.mean(____) + ____
het_shifted = ____ - ____ + ____
# Compute 10,000 bootstrap replicates from shifted arrays
bs_reps_wt = ____
bs_reps_het = ____
# Get replicates of difference of means: bs_replicates
bs_reps = ____ - ____
# Compute and print p-value: p
p = ____(____ >= ____) / len(____)
print('p-value =', p)