PCA uitvoeren
De volgende stap in je analyse is PCA uitvoeren op wisc.data.
Je zag in het vorige hoofdstuk dat het belangrijk is om te controleren of de data geschaald moeten worden voordat je PCA uitvoert. Herhaal twee veelvoorkomende redenen om data te schalen:
- De invoervariabelen gebruiken verschillende meeteenheden.
- De invoervariabelen hebben aanzienlijk verschillende varianties.
Deze oefening maakt deel uit van de cursus
Unsupervised learning in R
Oefeninstructies
De variabelen die je eerder hebt gemaakt, wisc.data en diagnosis, zijn nog steeds beschikbaar in je werkruimte.
- Controleer het gemiddelde en de standaardafwijking van de features van de data om te bepalen of de data geschaald moeten worden. Gebruik de functies
colMeans()enapply()zoals je eerder hebt gedaan. - Voer PCA uit op
wisc.data, schaal indien nodig, en wijs het model toe aanwisc.pr. - Bekijk een samenvatting van de resultaten met de functie
summary().
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results