Uji hipotesis: apakah frekuensi gempa berubah?
Jelas terjadi peningkatan besar dalam frekuensi gempa setelah injeksi air limbah dimulai. Namun demikian, Anda tetap akan melakukan uji hipotesis sebagai latihan. Anda tidak akan menguji hipotesis bahwa waktu antargempa memiliki sebaran yang sama sebelum dan sesudah 2010, karena injeksi air limbah mungkin memengaruhi sebaran. Sebagai gantinya, Anda akan berasumsi bahwa mean-nya sama. Jadi, hitung p-value yang terkait dengan hipotesis bahwa waktu antargempa pra- dan pasca-2010 memiliki mean yang sama, dengan menggunakan mean selang waktu pra-2010 dikurangi mean selang waktu pasca-2010 sebagai statistik uji Anda.
Latihan ini adalah bagian dari kursus
Studi Kasus dalam Pemikiran Statistik
Petunjuk latihan
- Hitung statistik uji teramati. Variabel
mean_dt_predanmean_dt_postdari latihan sebelumnya sudah ada di namespace Anda. - Geser data pasca-2010 agar memiliki mean yang sama dengan data pra-2010. Simpan hasilnya sebagai
dt_post_shift. - Ambil masing-masing 10.000 replikasi bootstrap dari mean
dt_predandt_post_shift. Simpan hasilnya masing-masing dalambs_reps_predanbs_reps_post. - Hitung replikasi selisih mean dengan mengurangkan
bs_reps_postdaribs_reps_pre. - Hitung dan cetak p-value. Anggap "setidaknya sebesar ini" berarti statistik uji lebih besar dari atau sama dengan nilai yang teramati.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Compute the observed test statistic
mean_dt_diff = ____ - ____
# Shift the post-2010 data to have the same mean as the pre-2010 data
dt_post_shift = ____ - ____ + ____
# Compute 10,000 bootstrap replicates from arrays
bs_reps_pre = ____
bs_reps_post = ____
# Get replicates of difference of means
bs_reps = ____ - ____
# Compute and print the p-value
p_val = ____(____ >= ____) / 10000
print('p =', p_val)