1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 실험 설계

Connected

연습 문제

NHANES 데이터셋 구성

NHANES 웹사이트에서 내려받으면 NHANES 데이터셋은 SAS 고유 형식인 .XPT 파일로 각각 제공돼요. 다행히 haven 패키지를 사용할 수 있습니다.

원본 .XPT 형식으로 제공되고 변수 DEMO_file, MCQ_file, BMX_file을 통해 접근 가능한 NHANES Demographics, Medical Conditions, Body Measures 데이터셋을 결합해 봅시다. 세 데이터셋은 SEQN 변수를 기준으로 조인하세요. 이를 수행하는 좋은 방법은 요소들을 유용하게 결합할 수 있는 Reduce()를 사용하는 것입니다.

제공된 조인 코드는 다음을 수행합니다:

  • 세 데이터셋(nhanes_demo, nhanes_medical, nhanes_bodymeasures)의 리스트를 만듭니다.
  • Reduce() 내부에 사용자 정의 함수를 사용하여 "SEQN" 변수를 기준으로 세 데이터셋을 inner join 합니다.
  • 결과를 nhanes_combined 데이터셋으로 저장합니다.

지침

100 XP
  • haven 패키지를 불러오세요.
  • 세 데이터 파일을 각각 별도의 read_xpt() 호출로 가져오세요. 이때 read_xpt()의 입력은 DEMO_file, MCQ_file, BMX_file이며, 반환된 데이터를 각각 nhanes_demo, nhanes_medical, nhanes_bodymeasures로 저장하세요.
  • 제공된 코드를 사용해 방금 가져온 세 데이터셋을 병합하여 nhanes_combined를 생성하세요.