Teste de hipótese para correlação de Pearson
A correlação observada entre analfabetismo feminino e fecundidade pode ter ocorrido por acaso; a fecundidade de um país pode, na verdade, ser totalmente independente do seu analfabetismo. Você vai testar essa hipótese. Para isso, permute os valores de analfabetismo, mas mantenha fixos os valores de fecundidade. Isso simula a hipótese de que eles são totalmente independentes entre si. Para cada permutação, calcule o coeficiente de correlação de Pearson e verifique quantas das suas réplicas por permutação têm um coeficiente de correlação de Pearson maior do que o observado.
A função pearson_r() que você escreveu na primeira parte deste curso para calcular o coeficiente de correlação de Pearson já está disponível para você.
Este exercício faz parte do curso
Pensamento Estatístico em Python (Parte 2)
Instruções do exercício
- Calcule a correlação de Pearson observada entre
illiteracyefertility. - Inicialize um array para armazenar suas réplicas por permutação.
- Escreva um loop
forpara gerar 10.000 réplicas:- Permute as medições de
illiteracyusandonp.random.permutation(). - Calcule a correlação de Pearson entre o array de analfabetismo permutado,
illiteracy_permuted, efertility.
- Permute as medições de
- Calcule e imprima o p-valor a partir das réplicas.
Exercício interativo prático
Experimente este exercício completando este código de exemplo.
# Compute observed correlation: r_obs
r_obs = ____
# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)
# Draw replicates
for ____ in ____:
# Permute illiteracy measurments: illiteracy_permuted
illiteracy_permuted = ____
# Compute Pearson correlation
perm_replicates[i] = ____
# Compute p-value: p
p = ____
print('p-val =', p)