Hauptkomponenten verstehen
Die Hauptkomponentenanalyse (PCA) reduziert die Dimensionalität, indem sie sich nicht überschneidende Merkmalsinformationen kombiniert. PCA extrahiert neue Merkmale, sogenannte Hauptkomponenten, die voneinander unabhängig sind. Eine Möglichkeit, PCA zu verstehen, ist, die wichtigsten Hauptkomponenten auf der x- und y-Achse zu plotten und die Merkmalsvektoren anzuzeigen. So kannst du sehen, welche Merkmale zu jeder Hauptkomponente beitragen. Auch wenn es nicht immer leicht ist, ist es gute Praxis, die Hauptkomponenten anhand der Merkmale zu benennen, die zu ihnen beitragen. Als Methode der Merkmalsextraktion ist PCA jedoch oft schwer zu interpretieren.
Ein Teil der Kreditdaten ist in credit_df enthalten. Die Zielvariable ist credit_score. Die Pakete tidyverse und ggfortify wurden bereits für dich geladen.
Diese Übung ist Teil des Kurses
<Kurs>Dimensionsreduktion in R</Kurs>Übungsanweisungen
- Führe eine Hauptkomponentenanalyse auf
credit_dfdurch. - Verwende
autoplot(), um die ersten beiden Hauptkomponenten, die Merkmalsvektoren und Labels anzuzeigen undcredit_scoreper Farbe zu codieren.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)
# Plot principal components and feature vectors
___(___,
data = ___,
colour = '___',
alpha = 0.3,
loadings = ___,
loadings.label = ___,
loadings.colour = "black",
loadings.label.colour = "black")