Escalar datos antes del PCA
Cuando trabajas con datos cuyas variables están en escalas diferentes, a menudo es importante escalarlos primero. Esto se debe a que las variables con valores más grandes pueden influir en el análisis incluso si su variabilidad es relativamente pequeña.
El data frame combine ya está cargado para ti.
Este ejercicio forma parte del curso
Álgebra lineal para data science en R
Instrucciones del ejercicio
- Usa la función
scale()para escalar las columnas 5 a 12 decombine. Llama a este data frameBy muestra algunos valores conhead(). - Usa
prcomp()para realizar el análisis de componentes principales sobre esos datos y resume el análisis consummary().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Scale columns 5-12 of combine
B <- ___(___[, 5:12])
# Print the first 6 rows of the data
___
# Summarize the principal component analysis
summary(____(B))