Hauptkomponenten verstehen

Die Hauptkomponentenanalyse (PCA) reduziert die Dimensionalität, indem sie sich nicht überschneidende Merkmalsinformationen kombiniert. PCA extrahiert neue Merkmale, sogenannte Hauptkomponenten, die voneinander unabhängig sind. Eine Möglichkeit, PCA zu verstehen, ist, die wichtigsten Hauptkomponenten auf der x- und y-Achse zu plotten und die Merkmalsvektoren anzuzeigen. So kannst du sehen, welche Merkmale zu jeder Hauptkomponente beitragen. Auch wenn es nicht immer leicht ist, ist es gute Praxis, die Hauptkomponenten anhand der Merkmale zu benennen, die zu ihnen beitragen. Als Methode der Merkmalsextraktion ist PCA jedoch oft schwer zu interpretieren.

Ein Teil der Kreditdaten ist in credit_df enthalten. Die Zielvariable ist credit_score. Die Pakete tidyverse und ggfortify wurden bereits für dich geladen.

Diese Übung ist Teil des Kurses

Dimensionsreduktion in R

Kurs anzeigen

Anleitung zur Übung

Führe eine Hauptkomponentenanalyse auf credit_df durch.
Verwende autoplot(), um die ersten beiden Hauptkomponenten, die Merkmalsvektoren und Labels anzuzeigen und credit_score per Farbe zu codieren.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)

# Plot principal components and feature vectors
___(___, 
         data = ___, 
         colour = '___', 
         alpha = 0.3,
         loadings = ___, 
         loadings.label = ___, 
         loadings.colour = "black", 
         loadings.label.colour = "black")

Code bearbeiten und ausführen