ComenzarEmpieza gratis

Covarianza vs correlación

La covarianza mide si dos variables cambian ("varían") juntas. Se calcula obteniendo, punto por punto, los productos de las desviaciones vistas en el ejercicio anterior, dx[n]*dy[n], y luego hallando el promedio de todos esos productos.

La correlación es, en esencia, la covarianza normalizada. En este ejercicio, se te proporcionan dos arrays de datos que están muy correlacionados, y visualizarás y calcularás tanto la covariance como la correlation.

Este ejercicio forma parte del curso

Introducción al modelado lineal en Python

Ver curso

Instrucciones del ejercicio

  • Calcula las desviaciones, dx y dy, restando la media con np.mean(), y calcula covariance como la media de su producto dx*dy.
  • Calcula las desviaciones normalizadas, zx y zy, dividiendo por la desviación estándar con np.std(), y calcula la correlation como la media de su producto, zx*zy.
  • Usa plot_normalized_deviations(zx, zy) para representar el producto de las desviaciones normalizadas y comprobar visualmente que coincide con el valor de la correlación.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Compute the covariance from the deviations.
dx = x - np.____(x)
dy = y - np.____(y)
covariance = np.____(____ * ____)
print("Covariance: ", covariance)

# Compute the correlation from the normalized deviations.
zx = dx / np.____(x)
zy = dy / np.____(y)
correlation = np.____(____ * ____)
print("Correlation: ", correlation)

# Plot the normalized deviations for visual inspection. 
fig = plot_normalized_deviations(zx, zy)
Editar y ejecutar código