Aan de slagBegin gratis

Redundantie opsporen

Een van de belangrijkste dingen die principal component analysis kan doen, is de redundantie in je gegevensset verkleinen. In de simpelste vorm treedt redundantie op wanneer twee variabelen gecorreleerd zijn.

De Pearson-correlatiecoëfficiënt is een getal tussen -1 en 1. Coëfficiënten rond nul duiden erop dat twee variabelen lineair onafhankelijk zijn, terwijl coëfficiënten rond -1 of 1 aangeven dat twee variabelen lineair samenhangen.

De gegevensset combine is voor je geladen.

Deze oefening maakt deel uit van de cursus

Lineaire algebra voor data science in R

Bekijk cursus

Interactieve oefening met praktijkervaring

Probeer deze oefening door deze voorbeeldcode aan te vullen.

# Print the first 6 observations of the dataset
___
Code bewerken en uitvoeren