Correlazione e R-quadro
La correlazione lineare di due variabili, \(x\) e \(y\), misura l'intensità della relazione lineare tra di esse. Quando \(x\) e \(y\) sono rispettivamente:
- le predizioni di un modello di regressione che minimizza l'errore quadratico (come la regressione lineare) e
- i valori reali dei dati di training,
allora il quadrato della correlazione coincide con \(R^2\). In questo esercizio lo verificherai.
unemployment e unemployment_model sono a tua disposizione.
Questo esercizio fa parte del corso
Supervised Learning in R: Regression
Istruzioni dell'esercizio
- Usa
cor()(docs) per calcolare la correlazione tra le predizioni e la disoccupazione femminile. Assegnala alla variabilerhoe stampala. Assicurati di usare la correlazione di Pearson (impostazione predefinita). - Eleva al quadrato
rhoe assegnala arho2. Stampala. - Confronta
rho2con \(R^2\) del modello (usandoglance()). È lo stesso valore?
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# unemployment is available
summary(unemployment)
# unemployment_model is available
summary(unemployment_model)
# Get the correlation between the prediction and true outcome: rho and print it
(rho <- ___)
# Square rho: rho2 and print it
(rho2 <- ___)
# Get R-squared from glance and print it
(rsq_glance <- ___(___)$___)