CommencerCommencez gratuitement

Mettre les données à l’échelle avant une ACP

Lorsque les variables n’ont pas la même échelle, il est souvent essentiel de mettre d’abord les données à l’échelle. En effet, des variables avec des valeurs plus grandes peuvent influencer l’analyse même si leur variabilité est relativement faible.

Le data frame combine est déjà chargé pour vous.

Cet exercice fait partie du cours

<cours>Algèbre linéaire pour la data science en R</cours>
Voir le cours

Instructions de l’exercice

  • Utilisez la fonction scale() pour mettre à l’échelle les colonnes 5 à 12 des données combine. Nommez ce data frame B et affichez quelques valeurs avec head().
  • Utilisez prcomp() pour réaliser une analyse en composantes principales sur ces données, puis résumez l’analyse avec summary().

Exercice interactif pratique

Essayez cet exercice en complétant ce code d’exemple.

# Scale columns 5-12 of combine
B <- ___(___[, 5:12])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
summary(____(B))
Modifier et exécuter le code