Er is nog één stap in de datacleaning om dit beter interpreteerbaar te maken. Op dit moment worden topics weergegeven met tweeletterige codes:

me: Palestinian conflict
nu: Nuclear weapons and nuclear material
di: Arms control and disarmament
hr: Human rights
co: Colonialism
ec: Economic development

Zodat je de gegevens makkelijker kunt interpreteren, kun je de codes hercoderen naar hun volledige naam. Dat kan met de recode()-functie van dplyr, die waarden vervangt door waarden die je opgeeft:

example <- c("apple", "banana", "apple", "orange")
recode(example,
       apple = "plum",
       banana = "grape")

Tidy data

Create Your Free Account