Teste de hipótese por bootstrap
O teste de permutação tem uma hipótese bem restritiva: que os comprimentos de intervalos dos tipos heterozigoto e selvagem são distribuídos de forma idêntica. Agora, use um teste de hipótese por bootstrap para testar a hipótese de que as médias são iguais, sem fazer suposições sobre as distribuições.
Este exercício faz parte do curso
Estudos de caso em pensamento estatístico
Instruções do exercício
- Crie um array,
bout_lengths_concat, que contenha todos os comprimentos de intervalos tanto do tipo selvagem (bout_lengths_wt) quanto do heterozigoto (bout_lengths_het) usandonp.concatenate(). - Calcule a média de todos os comprimentos de intervalos desse array concatenado (
bout_lengths_concat), armazenando o resultado na variávelmean_bout_length. - Desloque ambos os conjuntos de dados de modo que tenham a mesma média,
mean_bout_length. Armazene os arrays deslocados nas variáveiswt_shiftedehet_shifted. - Use
dcst.draw_bs_reps()para obter 10.000 réplicas de bootstrap da média para cada um dos conjuntos de dados deslocados. Armazene as respectivas réplicas embs_reps_wtebs_reps_het. - Subtraia
bs_reps_wtdebs_reps_hetpara obter as réplicas de bootstrap da diferença de médias. Armazene os resultados na variávelbs_reps. - Calcule o valor de p, definindo "pelo menos tão extremo quanto" como a diferença de médias sob a hipótese nula ser maior ou igual à observada experimentalmente. A variável
diff_means_expdo exercício anterior já está no seu ambiente.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Concatenate arrays: bout_lengths_concat
bout_lengths_concat = ____((____, ____))
# Compute mean of all bout_lengths: mean_bout_length
mean_bout_length = ____
# Generate shifted arrays
wt_shifted = ____ - np.mean(____) + ____
het_shifted = ____ - ____ + ____
# Compute 10,000 bootstrap replicates from shifted arrays
bs_reps_wt = ____
bs_reps_het = ____
# Get replicates of difference of means: bs_replicates
bs_reps = ____ - ____
# Compute and print p-value: p
p = ____(____ >= ____) / len(____)
print('p-value =', p)