CommencerCommencer gratuitement

Mettre les données à l’échelle avant une ACP

Lorsque les variables n’ont pas la même échelle, il est souvent essentiel de mettre d’abord les données à l’échelle. En effet, des variables avec des valeurs plus grandes peuvent influencer l’analyse même si leur variabilité est relativement faible.

Le data frame combine est déjà chargé pour vous.

Cet exercice fait partie du cours

Algèbre linéaire pour la data science en R

Afficher le cours

Instructions

  • Utilisez la fonction scale() pour mettre à l’échelle les colonnes 5 à 12 des données combine. Nommez ce data frame B et affichez quelques valeurs avec head().
  • Utilisez prcomp() pour réaliser une analyse en composantes principales sur ces données, puis résumez l’analyse avec summary().

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Scale columns 5-12 of combine
B <- ___(___[, 5:12])

# Print the first 6 rows of the data
___

# Summarize the principal component analysis
summary(____(B))
Modifier et exécuter le code