Recoder les thématiques

Il reste une étape de nettoyage pour rendre les données plus lisibles. Pour l’instant, les thématiques sont représentées par des codes à deux lettres :

me : Conflit palestinien
nu : Armes et matières nucléaires
di : Contrôle des armements et désarmement
hr : Droits de l’homme
co : Colonialisme
ec : Développement économique

Pour faciliter l’interprétation, re-codez les données afin de remplacer ces codes par leur libellé complet. Vous pouvez utiliser la fonction recode() de dplyr, qui remplace des valeurs par celles que vous spécifiez :

example <- c("apple", "banana", "apple", "orange")
recode(example,
       apple = "plum",
       banana = "grape")

Cet exercice fait partie du cours

Étude de cas : analyse exploratoire de données en R

Afficher le cours

Instructions

Utilisez la fonction recode() de dplyr dans un mutate() pour remplacer chaque code à deux lettres du data frame votes_gathered par le libellé complet correspondant. Enregistrez le résultat dans votes_tidied.

Exercice interactif pratique

Essayez cet exercice en complétant cet exemple de code.

# Replace the two-letter codes in topic: votes_tidied
votes_tidied <- ___ %>%
  mutate(topic = recode(___,
                        ___ = "Palestinian conflict",
                        ___ = "Nuclear weapons and nuclear material",
                        ___ = "Arms control and disarmament",
                        ___ = "Human rights",
                        ___ = "Colonialism",
                        ___ = "Economic development"))

Modifier et exécuter le code