ComenzarEmpieza gratis

Comprender los componentes principales

El análisis de componentes principales (PCA) reduce la dimensionalidad combinando la información no solapada de las variables. PCA extrae nuevas variables llamadas componentes principales que son independientes entre sí. Una forma de entender PCA es representar los componentes principales más importantes en los ejes x e y y mostrar los vectores de las variables. Esto te permite ver qué variables contribuyen a cada componente principal. Aunque no siempre es sencillo, es una buena práctica poner nombre a los componentes principales en función de las variables que más contribuyen. Sin embargo, como método de extracción de características, PCA suele ser difícil de interpretar.

Un subconjunto de los datos de crédito está en credit_df. La variable objetivo es credit_score. Los paquetes tidyverse y ggfortify también se han cargado por ti.

Este ejercicio forma parte del curso

Reducción de la dimensionalidad en R

Ver curso

Instrucciones del ejercicio

  • Realiza un análisis de componentes principales sobre credit_df.
  • Usa autoplot() para mostrar los dos primeros componentes principales, los vectores y etiquetas de las variables, y codifica credit_score por color.

Ejercicio interactivo práctico

Prueba este ejercicio y completa el código de muestra.

# Perform PCA
pca_res <- ___(___ %>% select(-___), scale. = ___)

# Plot principal components and feature vectors
___(___, 
         data = ___, 
         colour = '___', 
         alpha = 0.3,
         loadings = ___, 
         loadings.label = ___, 
         loadings.colour = "black", 
         loadings.label.colour = "black")
Editar y ejecutar código