IniziaInizia gratis

Covarianza vs Correlazione

La covarianza misura se due variabili cambiano ("variano") insieme. Si calcola computando i prodotti, punto per punto, delle deviazioni viste nell'esercizio precedente, dx[n]*dy[n], e poi trovando la media di tutti quei prodotti.

La correlazione è, in sostanza, la covarianza normalizzata. In questo esercizio ti vengono fornite due array di dati, fortemente correlati, e visualizzerai e calcolerai sia la covariance sia la correlation.

Questo esercizio fa parte del corso

Introduzione alla modellazione lineare in Python

Visualizza il corso

Istruzioni dell'esercizio

  • Calcola le deviazioni, dx e dy, sottraendo la media con np.mean(), e calcola la covariance come media del loro prodotto dx*dy.
  • Calcola le deviazioni normalizzate, zx e zy, dividendo per la deviazione standard con np.std(), e calcola la correlation come media del loro prodotto zx*zy.
  • Usa plot_normalized_deviations(zx, zy) per tracciare il prodotto delle deviazioni normalizzate e verificare visivamente il risultato rispetto al valore della correlazione.

Esercizio pratico interattivo

Prova a risolvere questo esercizio completando il codice di esempio.

# Compute the covariance from the deviations.
dx = x - np.____(x)
dy = y - np.____(y)
covariance = np.____(____ * ____)
print("Covariance: ", covariance)

# Compute the correlation from the normalized deviations.
zx = dx / np.____(x)
zy = dy / np.____(y)
correlation = np.____(____ * ____)
print("Correlation: ", correlation)

# Plot the normalized deviations for visual inspection. 
fig = plot_normalized_deviations(zx, zy)
Modifica ed esegui il codice