Visualiseer verklaarde variantie
Nu ga je een screeplot maken met het aandeel van de variantie dat door elke hoofdcomponent wordt verklaard, én de cumulatieve proportie van verklaarde variantie.
Herinner je uit de video dat deze grafieken helpen bepalen hoeveel hoofdcomponenten je moet behouden. Eén manier is te zoeken naar een knik (elbow) in de screeplot die laat zien dat naarmate het aantal hoofdcomponenten toeneemt, de snelheid waarmee variantie wordt verklaard sterk afneemt. Als er geen duidelijke knik is, kun je de screeplot gebruiken als leidraad om een drempel te kiezen.
Deze oefening maakt deel uit van de cursus
Unsupervised learning in R
Oefeninstructies
De proportie van verklaarde variantie staat nog steeds in het object pve dat je in de vorige oefening hebt gemaakt.
- Gebruik
plot()om de proportie verklaarde variantie per hoofdcomponent te plotten. - Gebruik
plot()encumsum()(cumulatieve som) om de cumulatieve proportie verklaarde variantie te plotten als functie van het aantal hoofdcomponenten.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Plot variance explained for each principal component
plot(___, xlab = "Principal Component",
ylab = "Proportion of Variance Explained",
ylim = c(0, 1), type = "b")
# Plot cumulative proportion of variance explained
plot(___, xlab = "Principal Component",
ylab = "Cumulative Proportion of Variance Explained",
ylim = c(0, 1), type = "b")