Teste de hipótese: a frequência de terremotos mudou?
É claro que houve um aumento enorme na frequência de terremotos depois que a injeção de água residuária começou. Mesmo assim, você vai fazer um teste de hipótese para praticar. Você não vai testar a hipótese de que os tempos entre terremotos têm a mesma distribuição antes e depois de 2010, já que a injeção pode afetar a distribuição. Em vez disso, você vai assumir que eles têm a mesma média. Então, calcule o p-valor associado à hipótese de que os tempos entre terremotos pré e pós-2010 têm a mesma média, usando a média dos intervalos pré-2010 menos a média dos intervalos pós-2010 como sua estatística de teste.
Este exercício faz parte do curso
Estudos de caso em pensamento estatístico
Instruções do exercício
- Calcule a estatística de teste observada. As variáveis
mean_dt_preemean_dt_postdos exercícios anteriores estão no seu ambiente. - Desloque os dados pós-2010 para que tenham a mesma média que os dados pré-2010. Guarde o resultado em
dt_post_shift. - Gere 10.000 réplicas bootstrap das médias de
dt_preedt_post_shift. Guarde os resultados, respectivamente, embs_reps_preebs_reps_post. - Calcule as réplicas da diferença de médias subtraindo
bs_reps_postdebs_reps_pre. - Calcule e imprima o p-valor. Considere "pelo menos tão extremo quanto" como sendo a estatística de teste maior ou igual ao que foi observado.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute the observed test statistic
mean_dt_diff = ____ - ____
# Shift the post-2010 data to have the same mean as the pre-2010 data
dt_post_shift = ____ - ____ + ____
# Compute 10,000 bootstrap replicates from arrays
bs_reps_pre = ____
bs_reps_post = ____
# Get replicates of difference of means
bs_reps = ____ - ____
# Compute and print the p-value
p_val = ____(____ >= ____) / 10000
print('p =', p_val)