Covarianza vs Correlazione
La covarianza misura se due variabili cambiano ("variano") insieme. Si calcola computando i prodotti, punto per punto, delle deviazioni viste nell'esercizio precedente, dx[n]*dy[n], e poi trovando la media di tutti quei prodotti.
La correlazione è, in sostanza, la covarianza normalizzata. In questo esercizio ti vengono fornite due array di dati, fortemente correlati, e visualizzerai e calcolerai sia la covariance sia la correlation.

Questo esercizio fa parte del corso
Introduzione alla modellazione lineare in Python
Istruzioni dell'esercizio
- Calcola le deviazioni,
dxedy, sottraendo la media connp.mean(), e calcola lacovariancecome media del loro prodottodx*dy. - Calcola le deviazioni normalizzate,
zxezy, dividendo per la deviazione standard connp.std(), e calcola lacorrelationcome media del loro prodottozx*zy. - Usa
plot_normalized_deviations(zx, zy)per tracciare il prodotto delle deviazioni normalizzate e verificare visivamente il risultato rispetto al valore della correlazione.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Compute the covariance from the deviations.
dx = x - np.____(x)
dy = y - np.____(y)
covariance = np.____(____ * ____)
print("Covariance: ", covariance)
# Compute the correlation from the normalized deviations.
zx = dx / np.____(x)
zy = dy / np.____(y)
correlation = np.____(____ * ____)
print("Correlation: ", correlation)
# Plot the normalized deviations for visual inspection.
fig = plot_normalized_deviations(zx, zy)