Hipotez testi: deprem sıklığı değişti mi?
Açıkça görüldüğü gibi, atık su enjeksiyonu başladıktan sonra deprem sıklığında büyük bir artış oldu. Yine de pratik olsun diye bir hipotez testi yapacaksın. 2010 öncesi ve sonrası deprem-arası sürelerin aynı dağılıma sahip olduğu hipotezini test etmeyeceksin; çünkü atık su enjeksiyonu dağılımı etkileyebilir. Bunun yerine, aynı ortalamaya sahip olduklarını varsayacaksın. Bu nedenle, test istatistiği olarak 2010 öncesi zaman boşluklarının ortalamasından 2010 sonrası zaman boşluklarının ortalamasını çıkararak, 2010 öncesi ve sonrası deprem-arası sürelerin aynı ortalamaya sahip olduğu hipotezi için p-değerini hesapla.
Bu egzersiz
İstatistiksel Düşünmede Vaka Çalışmaları
kursunun bir parçasıdırEgzersiz talimatları
- Gözlenen test istatistiğini hesapla. Önceki egzersizlerden
mean_dt_prevemean_dt_postdeğişkenleri çalışma alanında mevcut. - 2010 sonrası veriyi, 2010 öncesiyle aynı ortalamaya sahip olacak şekilde kaydır. Sonucu
dt_post_shiftolarak kaydet. dt_prevedt_post_shiftiçin ayrı ayrı 10.000'er bootstrap ortalama tekrar örneği çiz. Sonuçları sırasıylabs_reps_prevebs_reps_postiçinde sakla.- Ortalama farkı tekrar örneklerini,
bs_reps_pre'denbs_reps_post'u çıkararak hesapla. - p-değerini hesapla ve yazdır. "En az bu kadar aşırı" durumunu, test istatistiğinin gözlenen değere büyük ya da eşit olması olarak değerlendir.
Uygulamalı interaktif egzersiz
Bu örnek kodu tamamlayarak bu egzersizi bitirin.
# Compute the observed test statistic
mean_dt_diff = ____ - ____
# Shift the post-2010 data to have the same mean as the pre-2010 data
dt_post_shift = ____ - ____ + ____
# Compute 10,000 bootstrap replicates from arrays
bs_reps_pre = ____
bs_reps_post = ____
# Get replicates of difference of means
bs_reps = ____ - ____
# Compute and print the p-value
p_val = ____(____ >= ____) / 10000
print('p =', p_val)