Topics hercoderen
Er is nog één stap in de datacleaning om dit beter interpreteerbaar te maken. Op dit moment worden topics weergegeven met tweeletterige codes:
- me: Palestinian conflict
- nu: Nuclear weapons and nuclear material
- di: Arms control and disarmament
- hr: Human rights
- co: Colonialism
- ec: Economic development
Zodat je de gegevens makkelijker kunt interpreteren, kun je de codes hercoderen naar hun volledige naam. Dat kan met de recode()-functie van dplyr, die waarden vervangt door waarden die je opgeeft:
example <- c("apple", "banana", "apple", "orange")
recode(example,
apple = "plum",
banana = "grape")
Deze oefening maakt deel uit van de cursus
Casestudy: Exploratory Data Analysis in R
Oefeninstructies
Gebruik de functie recode() uit dplyr binnen een mutate() om elke tweeletterige code in het votes_gathered data frame te vervangen door de bijbehorende volledige naam. Sla dit op als votes_tidied.
Praktische interactieve oefening
Probeer deze oefening eens door deze voorbeeldcode in te vullen.
# Replace the two-letter codes in topic: votes_tidied
votes_tidied <- ___ %>%
mutate(topic = recode(___,
___ = "Palestinian conflict",
___ = "Nuclear weapons and nuclear material",
___ = "Arms control and disarmament",
___ = "Human rights",
___ = "Colonialism",
___ = "Economic development"))