Aan de slagGa gratis aan de slag

Correlatie en R-kwadraat

De lineaire correlatie van twee variabelen, \(x\) en \(y\), meet de sterkte van de lineaire relatie tussen die twee. Wanneer \(x\) en \(y\) respectievelijk:

  • de uitkomsten zijn van een regressiemodel dat de kwadratische fout minimaliseert (zoals lineaire regressie) en
  • de echte uitkomsten van de trainingsdata,

dan is het kwadraat van de correlatie gelijk aan \(R^2\). Dat ga je in deze oefening controleren.

unemployment en unemployment_model zijn voor je beschikbaar.

Deze oefening maakt deel uit van de cursus

Supervised Learning in R: Regressie

Cursus bekijken

Oefeninstructies

  • Gebruik cor() (docs) om de correlatie tussen de voorspellingen en vrouwelijke werkloosheid te krijgen. Sla deze op in de variabele rho en print hem. Zorg dat je de Pearson-correlatie gebruikt (de standaard).
  • Kwadreer rho en sla dit op in rho2. Print het.
  • Vergelijk rho2 met \(R^2\) uit het model (met glance()). Is het hetzelfde?

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# unemployment is available
summary(unemployment)

# unemployment_model is available
summary(unemployment_model)

# Get the correlation between the prediction and true outcome: rho and print it
(rho <- ___)

# Square rho: rho2 and print it
(rho2 <- ___)

# Get R-squared from glance and print it
(rsq_glance <- ___(___)$___)
Code bewerken en uitvoeren