CommencerCommencer gratuitement

Comparer les deux moitiés de votre jeu de données

Comme vous avez inspecté les caractéristiques de votre jeu de données complet, il est tout aussi important d’examiner les deux moitiés après avoir scindé les données. Vous pouvez toujours utiliser describe() sur chaque sous-ensemble, mais le package psych propose aussi des fonctions pour comparer un jeu de données selon une variable de regroupement.

Dans cet exercice, vous utiliserez les indices créés lors du découpage pour créer une variable de groupe et l’ajouter au jeu de données gcbs. Une fois cette variable en place, vous pourrez utiliser describeBy() et statsBy() pour afficher des statistiques descriptives de base ainsi que des statistiques entre groupes.

Attention : l’argument group de describeBy() doit être un vecteur, tandis que l’argument group de statsBy() doit être le nom d’une colonne de votre dataframe. Prévoyez en conséquence !

Cet exercice fait partie du cours

Analyse factorielle avec R

Afficher le cours

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Use the indices from the previous exercise to create a grouping variable
group_var <- vector("numeric", nrow(gcbs))
group_var[___] <- 1
group_var[___] <- 2
Modifier et exécuter le code