1. Học hỏi
  2. /
  3. Dự An
  4. /
  5. Nghiên cứu tình huống: Khám phá dữ liệu với R

Connected

Bài tập

Mã hóa lại các chủ đề

Còn một bước làm sạch dữ liệu nữa để kết quả dễ hiểu hơn. Hiện tại, các chủ đề được biểu diễn bằng mã hai chữ cái:

  1. me: Palestinian conflict
  2. nu: Nuclear weapons and nuclear material
  3. di: Arms control and disarmament
  4. hr: Human rights
  5. co: Colonialism
  6. ec: Economic development

Để bạn có thể diễn giải dữ liệu dễ dàng hơn, hãy mã hóa lại dữ liệu để thay các mã này bằng tên đầy đủ. Bạn có thể làm điều đó với hàm recode() của dplyr, hàm này thay thế các giá trị bằng những giá trị bạn chỉ định:

example <- c("apple", "banana", "apple", "orange")
recode(example,
       apple = "plum",
       banana = "grape")

Hướng dẫn

100 XP

Dùng hàm recode() từ dplyr trong mutate() để thay mỗi mã hai chữ cái trong data frame votes_gathered bằng tên đầy đủ tương ứng. Lưu kết quả thành votes_tidied.