Réaliser une ACP
L’étape suivante de votre analyse consiste à réaliser une ACP sur wisc.data.
Vous avez vu dans le chapitre précédent qu’il est important de vérifier si les données doivent être normalisées avant de lancer l’ACP. Rappelez-vous deux raisons courantes de mettre les données à l’échelle :
- Les variables d’entrée utilisent des unités de mesure différentes.
- Les variables d’entrée ont des variances nettement différentes.
Cet exercice fait partie du cours
Apprentissage non supervisé en R
Instructions
Les variables que vous avez créées précédemment, wisc.data et diagnosis, sont toujours disponibles dans votre espace de travail.
- Vérifiez la moyenne et l’écart type des variables pour déterminer si les données doivent être mises à l’échelle. Utilisez les fonctions
colMeans()etapply()comme vous l’avez déjà fait. - Exécutez l’ACP sur
wisc.data, avec normalisation si nécessaire, et affectez le modèle àwisc.pr. - Consultez un résumé des résultats avec la fonction
summary().
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Check column means and standard deviations
# Execute PCA, scaling if appropriate: wisc.pr
# Look at summary of results