ComeçarComece de graça

Teste de hipótese: a frequência de terremotos mudou?

É claro que houve um aumento enorme na frequência de terremotos depois que a injeção de água residuária começou. Mesmo assim, você vai fazer um teste de hipótese para praticar. Você não vai testar a hipótese de que os tempos entre terremotos têm a mesma distribuição antes e depois de 2010, já que a injeção pode afetar a distribuição. Em vez disso, você vai assumir que eles têm a mesma média. Então, calcule o p-valor associado à hipótese de que os tempos entre terremotos pré e pós-2010 têm a mesma média, usando a média dos intervalos pré-2010 menos a média dos intervalos pós-2010 como sua estatística de teste.

Este exercício faz parte do curso

Estudos de caso em pensamento estatístico

Ver curso

Instruções do exercício

  • Calcule a estatística de teste observada. As variáveis mean_dt_pre e mean_dt_post dos exercícios anteriores estão no seu ambiente.
  • Desloque os dados pós-2010 para que tenham a mesma média que os dados pré-2010. Guarde o resultado em dt_post_shift.
  • Gere 10.000 réplicas bootstrap das médias de dt_pre e dt_post_shift. Guarde os resultados, respectivamente, em bs_reps_pre e bs_reps_post.
  • Calcule as réplicas da diferença de médias subtraindo bs_reps_post de bs_reps_pre.
  • Calcule e imprima o p-valor. Considere "pelo menos tão extremo quanto" como sendo a estatística de teste maior ou igual ao que foi observado.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Compute the observed test statistic
mean_dt_diff = ____ - ____

# Shift the post-2010 data to have the same mean as the pre-2010 data
dt_post_shift = ____ - ____ + ____

# Compute 10,000 bootstrap replicates from arrays
bs_reps_pre = ____
bs_reps_post = ____

# Get replicates of difference of means
bs_reps = ____ - ____

# Compute and print the p-value
p_val = ____(____ >= ____) / 10000
print('p =', p_val)
Editar e executar o código