De covariantie berekenen
De covariantie kun je berekenen met de Numpy-functie np.cov(). Bijvoorbeeld: als we twee gegevensreeksen x en y hebben, dan geeft np.cov(x, y) een 2D-array terug waarbij de elementen [0,1] en [1,0] de covarianties zijn. Element [0,0] is de variantie van de data in x, en element [1,1] is de variantie van de data in y. Deze 2D-uitvoerarray heet de covariantiematrix, omdat hij de varianties en covarianties ordent.
Om je te herinneren hoe de lengte en breedte van I. versicolor-bloemblaadjes samenhangen, voegen we de scatterplot toe die je in een eerdere oefening hebt gemaakt.
Deze oefening maakt deel uit van de cursus
Statistisch denken in Python (deel 1)
Oefeninstructies
- Gebruik
np.cov()om de covariantiematrix te berekenen voor de bloemblaadjeslengte (versicolor_petal_length) en -breedte (versicolor_petal_width) van I. versicolor. - Print de covariantiematrix.
- Haal de covariantie op uit element
[0,1]van de covariantiematrix. Let op: door symmetrie is element[1,0]hetzelfde als[0,1]. - Print de covariantie.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Compute the covariance matrix: covariance_matrix
# Print covariance matrix
# Extract covariance of length and width of petals: petal_cov
# Print the length/width covariance