1. Learn
  2. /
  3. Courses
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

Exercise

예측자 행렬 사용하기

모형 기반 대치에서 내려야 할 중요한 결정 중 하나는 어떤 변수를 어떤 모형에서 예측 변수로 포함할지입니다. mice()에서는 예측자 행렬로 이를 제어하며, 기본적으로 모든 변수가 서로의 결측치를 대치하는 데 사용됩니다.

데이터에 변수가 많거나 충분한 시간이 없어 적절한 모형 선택을 하기 어렵다면, 변수들 간 상관관계를 바탕으로 예측자 행렬을 만들어 주는 mice의 기능을 사용할 수 있습니다. 이렇게 만든 행렬을 mice()에 넘기면 됩니다. 이 연습에서는 바로 이를 실습해 보겠습니다. 먼저 각 변수가 자신과 가장 상관이 높은 변수들을 사용해 대치되도록 예측자 행렬을 만들고, 그다음 이 예측자 행렬을 대치 함수에 전달해 보세요. 간단한 모형 선택을 해 봅시다!

Instructions 1/3

undefined XP
    1
    2
    3
  • 목표 변수와의 상관계수가 최소 0.1 이상인 예측 변수를 선택하는 예측자 행렬을 만들어 pred_mat에 할당하세요.