CommencerCommencer gratuitement

Covariance vs Corrélation

La covariance mesure si deux variables évoluent ("varient") ensemble. Elle se calcule en prenant, point par point, le produit des déviations vues dans l’exercice précédent, dx[n]*dy[n], puis en faisant la moyenne de tous ces produits.

La corrélation est, en essence, la covariance normalisée. Dans cet exercice, deux tableaux de données fortement corrélées vous sont fournis. Vous allez visualiser et calculer à la fois la covariance et la correlation.

Cet exercice fait partie du cours

Introduction à la modélisation linéaire en Python

Afficher le cours

Instructions

  • Calculez les déviations, dx et dy, en soustrayant la moyenne avec np.mean(), puis calculez la covariance comme la moyenne de leur produit dx*dy.
  • Calculez les déviations normalisées, zx et zy, en divisant par l’écart type avec np.std(), puis calculez la correlation comme la moyenne de leur produit zx*zy.
  • Utilisez plot_normalized_deviations(zx, zy) pour tracer le produit des déviations normalisées et le comparer visuellement à la valeur de corrélation.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Compute the covariance from the deviations.
dx = x - np.____(x)
dy = y - np.____(y)
covariance = np.____(____ * ____)
print("Covariance: ", covariance)

# Compute the correlation from the normalized deviations.
zx = dx / np.____(x)
zy = dy / np.____(y)
correlation = np.____(____ * ____)
print("Correlation: ", correlation)

# Plot the normalized deviations for visual inspection. 
fig = plot_normalized_deviations(zx, zy)
Modifier et exécuter le code