ComenzarEmpieza gratis

Prueba de hipótesis sobre la correlación de Pearson

La correlación observada entre analfabetismo femenino y fertilidad puede deberse al azar; la fertilidad de un país podría ser totalmente independiente de su analfabetismo. Vas a poner a prueba esta hipótesis. Para hacerlo, permuta los valores de analfabetismo pero deja fijos los de fertilidad. Esto simula la hipótesis de que son totalmente independientes entre sí. Para cada permutación, calcula el coeficiente de correlación de Pearson y comprueba cuántas de tus réplicas por permutación tienen un coeficiente de correlación de Pearson mayor que el observado.

La función pearson_r() que escribiste en la primera parte de este curso para calcular el coeficiente de correlación de Pearson ya está disponible para ti.

Este ejercicio forma parte del curso

Pensamiento estadístico en Python (Parte 2)

Ver curso

Instrucciones del ejercicio

  • Calcula la correlación de Pearson observada entre illiteracy y fertility.
  • Inicializa un array para guardar tus réplicas por permutación.
  • Escribe un bucle for para obtener 10.000 réplicas:
    • Permuta las mediciones de illiteracy usando np.random.permutation().
    • Calcula la correlación de Pearson entre el array de analfabetismo permutado, illiteracy_permuted, y fertility.
  • Calcula e imprime el valor p a partir de las réplicas.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Compute observed correlation: r_obs
r_obs = ____

# Initialize permutation replicates: perm_replicates
perm_replicates = np.empty(10000)

# Draw replicates
for ____ in ____:
    # Permute illiteracy measurments: illiteracy_permuted
    illiteracy_permuted = ____

    # Compute Pearson correlation
    perm_replicates[i] = ____

# Compute p-value: p
p = ____
print('p-val =', p)
Editar y ejecutar código