Hauptkomponenten verstehen
Die Hauptkomponentenanalyse (PCA) reduziert die Dimensionalität, indem sie sich nicht überschneidende Merkmalsinformationen kombiniert. PCA extrahiert neue Merkmale, sogenannte Hauptkomponenten, die voneinander unabhängig sind. Eine Möglichkeit, PCA zu verstehen, ist, die wichtigsten Hauptkomponenten auf der x- und y-Achse zu plotten und die Merkmalsvektoren anzuzeigen. So kannst du sehen, welche Merkmale zu jeder Hauptkomponente beitragen. Auch wenn es nicht immer leicht ist, ist es gute Praxis, die Hauptkomponenten anhand der Merkmale zu benennen, die zu ihnen beitragen. Als Methode der Merkmalsextraktion ist PCA jedoch oft schwer zu interpretieren.
Ein Teil der Kreditdaten ist in credit_df enthalten. Die Zielvariable ist credit_score. Die Pakete tidyverse und ggfortify wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
Dimensionsreduktion in R
Anleitung zur Übung
- Führe eine Hauptkomponentenanalyse auf
credit_dfdurch. - Verwende
autoplot(), um die ersten beiden Hauptkomponenten, die Merkmalsvektoren und Labels anzuzeigen undcredit_scoreper Farbe zu codieren.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)
# Plot principal components and feature vectors
___(___,
data = ___,
colour = '___',
alpha = 0.3,
loadings = ___,
loadings.label = ___,
loadings.colour = "black",
loadings.label.colour = "black")