Qu'est-ce qu'un facteur et pourquoi l'utiliser ? (3)
Il existe deux types de variables catégorielles : une variable catégorielle nominale et une variable catégorielle ordinale.
Une variable nominale est une variable catégorielle sans ordre implicite. Cela signifie qu'il est impossible de dire que « l'un vaut plus que l'autre ». Par exemple, imaginez la variable catégorielle animals_vector
avec les catégories "Elephant"
, "Giraffe"
, "Donkey"
et "Horse"
. Ici, il est impossible de dire que l'un se situe au-dessus ou au-dessous de l'autre (notez que certains d'entre vous pourraient ne pas être d'accord ;-) ).
En revanche, les variables ordinales ont un ordre naturel. Considérons par exemple la variable catégorielle temperature_vector
avec les catégories : "Low"
, "Medium"
et "High"
. Ici, il est évident que "Medium"
se trouve au-dessus de "Low"
, et que "High"
se trouve au-dessus de "Medium"
.
Cet exercice fait partie du cours
Introduction à R
Instructions
Exécutez le code pour vérifier comment R construit et affiche les variables nominales et ordinales. Ne vous inquiétez pas si vous ne comprenez pas encore tout le code, nous y reviendrons.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Animals
animals_vector <- c("Elephant", "Giraffe", "Donkey", "Horse")
factor_animals_vector <- factor(animals_vector)
factor_animals_vector
# Temperature
temperature_vector <- c("High", "Low", "High","Low", "Medium")
factor_temperature_vector <- factor(temperature_vector, order = TRUE, levels = c("Low", "Medium", "High"))
factor_temperature_vector