Correlatie en R-kwadraat
De lineaire correlatie van twee variabelen, \(x\) en \(y\), meet de sterkte van de lineaire relatie tussen die twee. Wanneer \(x\) en \(y\) respectievelijk:
- de uitkomsten zijn van een regressiemodel dat de kwadratische fout minimaliseert (zoals lineaire regressie) en
- de echte uitkomsten van de trainingsdata,
dan is het kwadraat van de correlatie gelijk aan \(R^2\). Dat ga je in deze oefening controleren.
unemployment en unemployment_model zijn voor je beschikbaar.
Deze oefening maakt deel uit van de cursus
Supervised Learning in R: Regressie
Oefeninstructies
- Gebruik
cor()(docs) om de correlatie tussen de voorspellingen en vrouwelijke werkloosheid te krijgen. Sla deze op in de variabelerhoen print hem. Zorg dat je de Pearson-correlatie gebruikt (de standaard). - Kwadreer
rhoen sla dit op inrho2. Print het. - Vergelijk
rho2met \(R^2\) uit het model (metglance()). Is het hetzelfde?
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# unemployment is available
summary(unemployment)
# unemployment_model is available
summary(unemployment_model)
# Get the correlation between the prediction and true outcome: rho and print it
(rho <- ___)
# Square rho: rho2 and print it
(rho2 <- ___)
# Get R-squared from glance and print it
(rsq_glance <- ___(___)$___)