Recoder les thématiques
Il reste une étape de nettoyage pour rendre les données plus lisibles. Pour l’instant, les thématiques sont représentées par des codes à deux lettres :
- me : Conflit palestinien
- nu : Armes et matières nucléaires
- di : Contrôle des armements et désarmement
- hr : Droits de l’homme
- co : Colonialisme
- ec : Développement économique
Pour faciliter l’interprétation, re-codez les données afin de remplacer ces codes par leur libellé complet. Vous pouvez utiliser la fonction recode() de dplyr, qui remplace des valeurs par celles que vous spécifiez :
example <- c("apple", "banana", "apple", "orange")
recode(example,
apple = "plum",
banana = "grape")
Cet exercice fait partie du cours
Étude de cas : analyse exploratoire de données en R
Instructions
Utilisez la fonction recode() de dplyr dans un mutate() pour remplacer chaque code à deux lettres du data frame votes_gathered par le libellé complet correspondant. Enregistrez le résultat dans votes_tidied.
Exercice interactif pratique
Essayez cet exercice en complétant cet exemple de code.
# Replace the two-letter codes in topic: votes_tidied
votes_tidied <- ___ %>%
mutate(topic = recode(___,
___ = "Palestinian conflict",
___ = "Nuclear weapons and nuclear material",
___ = "Arms control and disarmament",
___ = "Human rights",
___ = "Colonialism",
___ = "Economic development"))