Comprender los componentes principales
El análisis de componentes principales (PCA) reduce la dimensionalidad combinando la información no solapada de las variables. PCA extrae nuevas variables llamadas componentes principales que son independientes entre sí. Una forma de entender PCA es representar los componentes principales más importantes en los ejes x e y y mostrar los vectores de las variables. Esto te permite ver qué variables contribuyen a cada componente principal. Aunque no siempre es sencillo, es una buena práctica poner nombre a los componentes principales en función de las variables que más contribuyen. Sin embargo, como método de extracción de características, PCA suele ser difícil de interpretar.
Un subconjunto de los datos de crédito está en credit_df. La variable objetivo es credit_score. Los paquetes tidyverse y ggfortify también se han cargado por ti.
Este ejercicio forma parte del curso
Reducción de la dimensionalidad en R
Instrucciones del ejercicio
- Realiza un análisis de componentes principales sobre
credit_df. - Usa
autoplot()para mostrar los dos primeros componentes principales, los vectores y etiquetas de las variables, y codificacredit_scorepor color.
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)
# Plot principal components and feature vectors
___(___,
data = ___,
colour = '___',
alpha = 0.3,
loadings = ___,
loadings.label = ___,
loadings.colour = "black",
loadings.label.colour = "black")