Loadings en scores voor de hoofdcomponenten
Het hoofddoel van PCA is dimensiereductie, wat vaak nodig is om data met veel variabelen te kunnen bekijken. Het plotten van de PC-scores in twee dimensies is een manier om zulke hoog-dimensionale data te visualiseren.
Deze oefening maakt deel uit van de cursus
Multivariate kansverdelingen in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Create data frame of scores
scores.state <- data.frame(___)
# Plot of scores labeled by state name
ggplot(data = scores.state, aes(x = ___, y = ___, label = ___) +
geom_text( alpha = 0.8, size = 3) +
ggtitle("PCA of states data")