Comparer les deux moitiés de votre jeu de données
Comme vous avez inspecté les caractéristiques de votre jeu de données complet, il est tout aussi important d’examiner les deux moitiés après avoir scindé les données. Vous pouvez toujours utiliser describe() sur chaque sous-ensemble, mais le package psych propose aussi des fonctions pour comparer un jeu de données selon une variable de regroupement.
Dans cet exercice, vous utiliserez les indices créés lors du découpage pour créer une variable de groupe et l’ajouter au jeu de données gcbs. Une fois cette variable en place, vous pourrez utiliser describeBy() et statsBy() pour afficher des statistiques descriptives de base ainsi que des statistiques entre groupes.
Attention : l’argument group de describeBy() doit être un vecteur, tandis que l’argument group de statsBy() doit être le nom d’une colonne de votre dataframe. Prévoyez en conséquence !
Cet exercice fait partie du cours
Analyse factorielle avec R
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Use the indices from the previous exercise to create a grouping variable
group_var <- vector("numeric", nrow(gcbs))
group_var[___] <- 1
group_var[___] <- 2