1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế thí nghiệm với R

Connected

Bài tập

Xây dựng bộ dữ liệu NHANES

Khi tải từ trang web NHANES, các bộ dữ liệu NHANES chỉ có sẵn dưới dạng tệp .XPT, định dạng gốc của SAS. May mắn là chúng ta có gói haven.

Hãy kết hợp các bộ dữ liệu NHANES về Nhân khẩu học, Tình trạng y tế và Chỉ số cơ thể, hiện có ở định dạng .XPT thô và có thể truy cập qua các biến DEMO_file, MCQ_file và BMX_file. Gộp cả 3 bộ dữ liệu bằng biến SEQN. Một cách hay để làm việc này là dùng Reduce(), cho phép bạn kết hợp các phần tử theo cách hữu ích.

Đoạn mã gộp (đã được cung cấp) thực hiện các bước sau:

  • Tạo một danh sách chứa cả 3 bộ dữ liệu (nhanes_demo, nhanes_medical, nhanes_bodymeasures).
  • Dùng một hàm tùy chỉnh bên trong Reduce() để inner join cả 3 bộ dữ liệu theo biến "SEQN".
  • Lưu kết quả thành bộ dữ liệu nhanes_combined.

Hướng dẫn

100 XP
  • Nạp gói haven.
  • Nhập ba tệp dữ liệu bằng các lời gọi riêng tới read_xpt(), trong đó đầu vào cho 3 lời gọi read_xpt() này lần lượt là DEMO_file, MCQ_file và BMX_file, và lưu thành các bộ dữ liệu nhanes_demo, nhanes_medical và nhanes_bodymeasures.
  • Tạo nhanes_combined bằng cách gộp 3 bộ dữ liệu bạn vừa nhập, sử dụng đoạn mã đã cung cấp.