1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

연습 문제

기본 모델 선택하기

MICE는 데이터의 각 변수마다 별도의 대치(imputation) 모델을 생성해요. 어떤 모델이 쓰일지는 해당 변수의 유형에 따라 달라집니다. 우리가 사용할 모델의 종류를 지정하는 흔한 방법은 네 가지 변수 유형 각각에 대해 기본 모델을 설정하는 거예요.

이를 위해 mice()에 defaultMethod 인수를 전달하면 됩니다. 이 인수는 다음에 대한 기본 대치 방법을 담은 길이 4의 벡터여야 해요:

  1. 연속형 변수,
  2. 이진형 변수,
  3. 범주형 변수(순서가 없는 factor),
  4. 순서형 변수(순서가 있는 factor).

이번 연습에서는 mice 문서를 활용해 사용할 수 있는 방법 목록을 살펴보고, 알고리즘이 사용할 적절한 방법을 고르겠습니다. 모델 선택을 해 볼까요!

지침

100 XP
  • ?mice로 확인한 RDocumentation에는 각 방법에 해당하는 키워드 표가 있어요.
  • mice()를 사용해 biopics 데이터를 다음 기본 방법 순서로 대치하세요: 분류 및 회귀 나무, 선형 판별 분석, 예측 평균 매칭, 비례 오즈 모델.
  • 변수별로 어떤 방법이 사용되었는지 확인하기 위해 biopics_multiimp를 출력하세요.