Aan de slagGa gratis aan de slag

PCA uitvoeren

De volgende stap in je analyse is PCA uitvoeren op wisc.data.

Je zag in het vorige hoofdstuk dat het belangrijk is om te controleren of de data geschaald moeten worden voordat je PCA uitvoert. Herhaal twee veelvoorkomende redenen om data te schalen:

  1. De invoervariabelen gebruiken verschillende meeteenheden.
  2. De invoervariabelen hebben aanzienlijk verschillende varianties.

Deze oefening maakt deel uit van de cursus

Unsupervised learning in R

Cursus bekijken

Oefeninstructies

De variabelen die je eerder hebt gemaakt, wisc.data en diagnosis, zijn nog steeds beschikbaar in je werkruimte.

  • Controleer het gemiddelde en de standaardafwijking van de features van de data om te bepalen of de data geschaald moeten worden. Gebruik de functies colMeans() en apply() zoals je eerder hebt gedaan.
  • Voer PCA uit op wisc.data, schaal indien nodig, en wijs het model toe aan wisc.pr.
  • Bekijk een samenvatting van de resultaten met de functie summary().

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Check column means and standard deviations



# Execute PCA, scaling if appropriate: wisc.pr


# Look at summary of results
Code bewerken en uitvoeren