ComeçarComece de graça

Teste de hipótese por bootstrap

O teste de permutação tem uma hipótese bem restritiva: que os comprimentos de intervalos dos tipos heterozigoto e selvagem são distribuídos de forma idêntica. Agora, use um teste de hipótese por bootstrap para testar a hipótese de que as médias são iguais, sem fazer suposições sobre as distribuições.

Este exercício faz parte do curso

Estudos de caso em pensamento estatístico

Ver curso

Instruções do exercício

  • Crie um array, bout_lengths_concat, que contenha todos os comprimentos de intervalos tanto do tipo selvagem (bout_lengths_wt) quanto do heterozigoto (bout_lengths_het) usando np.concatenate().
  • Calcule a média de todos os comprimentos de intervalos desse array concatenado (bout_lengths_concat), armazenando o resultado na variável mean_bout_length.
  • Desloque ambos os conjuntos de dados de modo que tenham a mesma média, mean_bout_length. Armazene os arrays deslocados nas variáveis wt_shifted e het_shifted.
  • Use dcst.draw_bs_reps() para obter 10.000 réplicas de bootstrap da média para cada um dos conjuntos de dados deslocados. Armazene as respectivas réplicas em bs_reps_wt e bs_reps_het.
  • Subtraia bs_reps_wt de bs_reps_het para obter as réplicas de bootstrap da diferença de médias. Armazene os resultados na variável bs_reps.
  • Calcule o valor de p, definindo "pelo menos tão extremo quanto" como a diferença de médias sob a hipótese nula ser maior ou igual à observada experimentalmente. A variável diff_means_exp do exercício anterior já está no seu ambiente.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Concatenate arrays: bout_lengths_concat
bout_lengths_concat = ____((____, ____))

# Compute mean of all bout_lengths: mean_bout_length
mean_bout_length = ____

# Generate shifted arrays
wt_shifted = ____ - np.mean(____) + ____
het_shifted = ____ - ____ + ____

# Compute 10,000 bootstrap replicates from shifted arrays
bs_reps_wt = ____
bs_reps_het = ____

# Get replicates of difference of means: bs_replicates
bs_reps = ____ - ____

# Compute and print p-value: p
p = ____(____ >= ____) / len(____)
print('p-value =', p)
Editar e executar o código