Aan de slagGa gratis aan de slag

Data schalen vóór PCA

Als je werkt met data met kenmerken op verschillende schalen, is het vaak belangrijk om de data eerst te schalen. Data met grotere waarden kan de analyse namelijk beïnvloeden, zelfs bij relatief weinig variatie.

Het combine-data frame is voor je geladen.

Deze oefening maakt deel uit van de cursus

Lineaire algebra voor data science in R

Cursus bekijken

Oefeninstructies

  • Gebruik de functie scale() om de 5e tot en met de 12e kolom van combine te schalen. Noem dit data frame B en laat enkele waarden zien met head().
  • Gebruik prcomp() om een principalecomponentenanalyse op de data uit te voeren en vat deze analyse samen met summary().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Scale columns 5-12 of combine
B <- ___(___[, 5:12])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
summary(____(B))
Code bewerken en uitvoeren