Capire le componenti principali
La Principal Component Analysis (PCA) riduce la dimensionalità combinando le informazioni delle feature non sovrapposte. La PCA estrae nuove feature chiamate componenti principali, indipendenti tra loro. Un modo per capire la PCA è tracciare le principali componenti sugli assi x e y e visualizzare i vettori delle feature. In questo modo puoi vedere quali feature contribuiscono a ciascuna componente principale. Anche se non è sempre semplice, è buona pratica dare un nome alle componenti principali in base alle feature che vi contribuiscono. Tuttavia, come metodo di estrazione delle feature, la PCA è spesso difficile da interpretare.
Un sottoinsieme dei dati di credito è contenuto in credit_df. La variabile target è credit_score. I pacchetti tidyverse e ggfortify sono già stati caricati per te.
Questo esercizio fa parte del corso
Riduzione della dimensionalità in R
Istruzioni dell'esercizio
- Esegui la Principal Component Analysis su
credit_df. - Usa
autoplot()per visualizzare le prime due componenti principali, i vettori e le etichette delle feature, e codificacredit_scorecon il colore.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)
# Plot principal components and feature vectors
___(___,
data = ___,
colour = '___',
alpha = 0.3,
loadings = ___,
loadings.label = ___,
loadings.colour = "black",
loadings.label.colour = "black")