Aan de slagGa gratis aan de slag

Redundantie opsporen

Een van de belangrijkste dingen die principal component analysis kan doen, is de redundantie in je gegevensset verkleinen. In de simpelste vorm treedt redundantie op wanneer twee variabelen gecorreleerd zijn.

De Pearson-correlatiecoëfficiënt is een getal tussen -1 en 1. Coëfficiënten rond nul duiden erop dat twee variabelen lineair onafhankelijk zijn, terwijl coëfficiënten rond -1 of 1 aangeven dat twee variabelen lineair samenhangen.

De gegevensset combine is voor je geladen.

Deze oefening maakt deel uit van de cursus

Lineaire algebra voor data science in R

Cursus bekijken

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Print the first 6 observations of the dataset
___
Code bewerken en uitvoeren