Aan de slagGa gratis aan de slag

Topics hercoderen

Er is nog één stap in de datacleaning om dit beter interpreteerbaar te maken. Op dit moment worden topics weergegeven met tweeletterige codes:

  1. me: Palestinian conflict
  2. nu: Nuclear weapons and nuclear material
  3. di: Arms control and disarmament
  4. hr: Human rights
  5. co: Colonialism
  6. ec: Economic development

Zodat je de gegevens makkelijker kunt interpreteren, kun je de codes hercoderen naar hun volledige naam. Dat kan met de recode()-functie van dplyr, die waarden vervangt door waarden die je opgeeft:

example <- c("apple", "banana", "apple", "orange")
recode(example,
       apple = "plum",
       banana = "grape")

Deze oefening maakt deel uit van de cursus

Casestudy: Exploratory Data Analysis in R

Cursus bekijken

Oefeninstructies

Gebruik de functie recode() uit dplyr binnen een mutate() om elke tweeletterige code in het votes_gathered data frame te vervangen door de bijbehorende volledige naam. Sla dit op als votes_tidied.

Praktische interactieve oefening

Probeer deze oefening eens door deze voorbeeldcode in te vullen.

# Replace the two-letter codes in topic: votes_tidied
votes_tidied <- ___ %>%
  mutate(topic = recode(___,
                        ___ = "Palestinian conflict",
                        ___ = "Nuclear weapons and nuclear material",
                        ___ = "Arms control and disarmament",
                        ___ = "Human rights",
                        ___ = "Colonialism",
                        ___ = "Economic development"))
Code bewerken en uitvoeren