1. सीखें
  2. /
  3. पाठ्यक्रम
  4. /
  5. R로 배우는 실험 설계

Connected

अभ्यास

NHANES EDA

이제 탐색적 데이터 분석(EDA)의 관점에서 새로 만든 데이터셋을 살펴보겠습니다. 지난 장과 마찬가지로, 수치 요약 지표와 시각화를 모두 확인하는 것이 좋습니다. 이는 데이터를 이해하는 데 도움이 되고, 놓쳤을 수 있는 데이터 정제 단계도 찾아낼 수 있는 좋은 방법입니다. nhanes_combined 데이터셋은 미리 로드되어 있습니다.

NHANES 환자들에게 접근할 수 있고, 의사가 식이에서 칼로리/지방을 줄이라고 권고했을 때 체중에 미치는 효과를 연구한다고 가정해 봅시다. 이것이 우리의 처치(treatment)입니다. 실제로는 환자에게 질문한 항목이지만, 우리가 무작위로 일부 환자에게 영양 상담을 하게 했다고 가정하는 것이죠. 다만 환자의 성별에 따라 체중이 다를 수 있다고 의심합니다. 이는 차단 요인(blocking factor)입니다!

निर्देश

100 XP
  • dplyr 코드를 채워서 처치(mcq365d)별 평균 체중(bmxwt, kg)을 구하고 실행하세요. NA 처치를 받은 환자들에 대해 흥미로운 점이 있나요?
  • ggplot2 코드를 채워서 처치 변수별 환자 체중의 IQR을 보여주는 상자그림(boxplot)을 확인하세요.