CommencerCommencer gratuitement

Identifier les redondances

L’une des choses importantes que l’analyse en composantes principales permet de faire est de réduire la redondance dans votre jeu de données. Dans sa forme la plus simple, la redondance survient lorsque deux variables sont corrélées.

Le coefficient de corrélation de Pearson est un nombre compris entre -1 et 1. Des coefficients proches de zéro indiquent que deux variables sont linéairement indépendantes, tandis que des coefficients proches de -1 ou de 1 indiquent que deux variables sont liées linéairement.

Le jeu de données combine a été chargé pour vous.

Cet exercice fait partie du cours

Algèbre linéaire pour la data science en R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Print the first 6 observations of the dataset
___
Modifier et exécuter le code