Redundantie opsporen
Een van de belangrijkste dingen die principal component analysis kan doen, is de redundantie in je gegevensset verkleinen. In de simpelste vorm treedt redundantie op wanneer twee variabelen gecorreleerd zijn.
De Pearson-correlatiecoëfficiënt is een getal tussen -1 en 1. Coëfficiënten rond nul duiden erop dat twee variabelen lineair onafhankelijk zijn, terwijl coëfficiënten rond -1 of 1 aangeven dat twee variabelen lineair samenhangen.
De gegevensset combine is voor je geladen.
Deze oefening maakt deel uit van de cursus
Lineaire algebra voor data science in R
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Print the first 6 observations of the dataset
___