ComeçarComece de graça

Teste de hipótese para correlação de Pearson

A correlação observada entre analfabetismo feminino e fecundidade pode ter ocorrido por acaso; a fecundidade de um país pode, na verdade, ser totalmente independente do seu analfabetismo. Você vai testar essa hipótese. Para isso, permute os valores de analfabetismo, mas mantenha fixos os valores de fecundidade. Isso simula a hipótese de que eles são totalmente independentes entre si. Para cada permutação, calcule o coeficiente de correlação de Pearson e verifique quantas das suas réplicas por permutação têm um coeficiente de correlação de Pearson maior do que o observado.

A função pearson_r() que você escreveu na primeira parte deste curso para calcular o coeficiente de correlação de Pearson já está disponível para você.

Este exercício faz parte do curso

Pensamento Estatístico em Python (Parte 2)

Ver curso

Instruções do exercício

  • Calcule a correlação de Pearson observada entre illiteracy e fertility.
  • Inicialize um array para armazenar suas réplicas por permutação.
  • Escreva um loop for para gerar 10.000 réplicas:
    • Permute as medições de illiteracy usando np.random.permutation().
    • Calcule a correlação de Pearson entre o array de analfabetismo permutado, illiteracy_permuted, e fertility.
  • Calcule e imprima o p-valor a partir das réplicas.

Exercício interativo prático

Experimente este exercício completando este código de exemplo.

# Compute observed correlation: r_obs
r_obs = ____

# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)

# Draw replicates
for ____ in ____:
    # Permute illiteracy measurments: illiteracy_permuted
    illiteracy_permuted = ____

    # Compute Pearson correlation
    perm_replicates[i] = ____

# Compute p-value: p
p = ____
print('p-val =', p)
Editar e executar o código