Capire le componenti principali

La Principal Component Analysis (PCA) riduce la dimensionalità combinando le informazioni delle feature non sovrapposte. La PCA estrae nuove feature chiamate componenti principali, indipendenti tra loro. Un modo per capire la PCA è tracciare le principali componenti sugli assi x e y e visualizzare i vettori delle feature. In questo modo puoi vedere quali feature contribuiscono a ciascuna componente principale. Anche se non è sempre semplice, è buona pratica dare un nome alle componenti principali in base alle feature che vi contribuiscono. Tuttavia, come metodo di estrazione delle feature, la PCA è spesso difficile da interpretare.

Un sottoinsieme dei dati di credito è contenuto in credit_df. La variabile target è credit_score. I pacchetti tidyverse e ggfortify sono già stati caricati per te.

Questo esercizio fa parte del corso

Riduzione della dimensionalità in R

Visualizza corso

Istruzioni dell'esercizio

Esegui la Principal Component Analysis su credit_df.
Usa autoplot() per visualizzare le prime due componenti principali, i vettori e le etichette delle feature, e codifica credit_score con il colore.

esercizio interattivo pratico

Prova questo esercizio completando questo codice di esempio.

# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)

# Plot principal components and feature vectors
___(___, 
         data = ___, 
         colour = '___', 
         alpha = 0.3,
         loadings = ___, 
         loadings.label = ___, 
         loadings.colour = "black", 
         loadings.label.colour = "black")

Modifica ed esegui il codice