1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 실험 설계

Connected

연습 문제

NHANES EDA

이제 탐색적 데이터 분석(EDA)의 관점에서 새로 만든 데이터셋을 살펴보겠습니다. 지난 장과 마찬가지로, 수치 요약 지표와 시각화를 모두 확인하는 것이 좋습니다. 이는 데이터를 이해하는 데 도움이 되고, 놓쳤을 수 있는 데이터 정제 단계도 찾아낼 수 있는 좋은 방법입니다. nhanes_combined 데이터셋은 미리 로드되어 있습니다.

NHANES 환자들에게 접근할 수 있고, 의사가 식이에서 칼로리/지방을 줄이라고 권고했을 때 체중에 미치는 효과를 연구한다고 가정해 봅시다. 이것이 우리의 처치(treatment)입니다. 실제로는 환자에게 질문한 항목이지만, 우리가 무작위로 일부 환자에게 영양 상담을 하게 했다고 가정하는 것이죠. 다만 환자의 성별에 따라 체중이 다를 수 있다고 의심합니다. 이는 차단 요인(blocking factor)입니다!

지침

100 XP
  • dplyr 코드를 채워서 처치(mcq365d)별 평균 체중(bmxwt, kg)을 구하고 실행하세요. NA 처치를 받은 환자들에 대해 흥미로운 점이 있나요?
  • ggplot2 코드를 채워서 처치 변수별 환자 체중의 IQR을 보여주는 상자그림(boxplot)을 확인하세요.