Cálculo de la covarianza
La covarianza se puede calcular con la función de Numpy np.cov(). Por ejemplo, si tenemos dos conjuntos de datos x e y, np.cov(x, y) devuelve un array 2D donde las posiciones [0,1] y [1,0] son las covarianzas. La posición [0,0] es la varianza de los datos en x, y la posición [1,1] es la varianza de los datos en y. A este array 2D de salida se le llama matriz de covarianzas, ya que organiza las varianzas y covarianzas.
Para recordarte cómo se relacionan la longitud y la anchura de los pétalos de I. versicolor, incluimos el diagrama de dispersión que generaste en un ejercicio anterior.
Este ejercicio forma parte del curso
Pensamiento estadístico en Python (Parte 1)
Instrucciones del ejercicio
- Usa
np.cov()para calcular la matriz de covarianzas de la longitud (versicolor_petal_length) y la anchura (versicolor_petal_width) de los pétalos de I. versicolor. - Imprime la matriz de covarianzas.
- Extrae la covarianza de la posición
[0,1]de la matriz de covarianzas. Ten en cuenta que, por simetría, la posición[1,0]es igual a[0,1]. - Imprime la covarianza.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Compute the covariance matrix: covariance_matrix
# Print covariance matrix
# Extract covariance of length and width of petals: petal_cov
# Print the length/width covariance