Realizar un PCA
El siguiente paso de tu análisis es realizar PCA sobre wisc.data.
En el capítulo anterior viste que es importante comprobar si los datos necesitan escalarse antes de aplicar PCA. Recuerda dos motivos comunes para escalar datos:
- Las variables de entrada usan distintas unidades de medida.
- Las variables de entrada tienen varianzas significativamente diferentes.
Este ejercicio forma parte del curso
Unsupervised Learning in R
Instrucciones del ejercicio
Las variables que creaste antes, wisc.data y diagnosis, siguen disponibles en tu espacio de trabajo.
- Comprueba la media y la desviación estándar de las características de los datos para determinar si deberían escalarse. Usa las funciones
colMeans()yapply()como hiciste antes. - Ejecuta PCA sobre
wisc.data, escalando si corresponde, y asigna el modelo awisc.pr. - Revisa un resumen de los resultados con la función
summary().
Ejercicio interactivo práctico
Prueba este ejercicio y completa el código de muestra.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results