Data schalen vóór PCA
Als je werkt met data met kenmerken op verschillende schalen, is het vaak belangrijk om de data eerst te schalen. Data met grotere waarden kan de analyse namelijk beïnvloeden, zelfs bij relatief weinig variatie.
Het combine-data frame is voor je geladen.
Deze oefening maakt deel uit van de cursus
Lineaire algebra voor data science in R
Oefeninstructies
- Gebruik de functie
scale()om de 5e tot en met de 12e kolom vancombinete schalen. Noem dit data frameBen laat enkele waarden zien methead(). - Gebruik
prcomp()om een principalecomponentenanalyse op de data uit te voeren en vat deze analyse samen metsummary().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))