1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Thiết kế thí nghiệm với R

Connected

Bài tập

Khám phá dữ liệu NHANES (EDA)

Hãy xem xét bộ dữ liệu vừa xây dựng với tư duy EDA. Giống như chương trước, bạn nên xem cả các thước đo tóm tắt số và trực quan hóa. Chúng giúp bạn hiểu dữ liệu và là cách hay để phát hiện các bước làm sạch dữ liệu có thể đã bỏ sót. Bộ dữ liệu nhanes_combined đã được nạp sẵn cho bạn.

Giả sử bạn có quyền tiếp cận bệnh nhân NHANES và muốn thực hiện một nghiên cứu về tác động của việc được bác sĩ khuyên giảm calo/chất béo trong chế độ ăn lên cân nặng. Đây là yếu tố can thiệp (treatment); ta giả định rằng thay vì đây là câu hỏi hỏi bệnh nhân, ta đã ngẫu nhiên để một số bác sĩ tư vấn dinh dưỡng cho một số bệnh nhân. Tuy nhiên, ta nghi ngờ có thể có khác biệt về cân nặng dựa trên giới tính của bệnh nhân — một yếu tố chặn (blocking factor)!

Hướng dẫn

100 XP
  • Điền và chạy mã dplyr để tìm cân nặng trung bình (bmxwt) theo kg theo yếu tố can thiệp (mcq365d). Có điều gì thú vị về các bệnh nhân có giá trị NA ở biến can thiệp không?
  • Điền mã ggplot2 để xem boxplot của IQR cân nặng bệnh nhân theo biến can thiệp.