1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

연습 문제

선형 회귀를 활용한 대치

때로는 도메인 지식, 선행 연구, 혹은 상식만으로도 데이터의 변수들 사이 관계를 설명할 수 있습니다. 이런 경우에는 변수들이 서로에 미치는 영향을 어떻게 가정하는지까지 반영해, 사용자가 지정한 통계 모델에 따라 각 변수를 대치할 수 있는 모델 기반 대치가 훌륭한 해법이 됩니다.

연속형 변수에는 선형 회귀가 널리 쓰이는 선택지입니다. 다만 관계를 꼭 선형으로만 제한하는 것은 아닙니다! 예측 변수에 제곱 항이나 로그 변환을 포함할 수도 있어요. 이 연습 문제에서는 simputation 패키지를 사용해 tao 데이터에 단일 선형 회귀 대치를 수행하고 결과를 살펴보겠습니다. 함께 해볼까요?

지침 1/4

undefined XP
    1
    2
    3
    4
  • simputation 패키지를 불러오세요.
  • impute_lm()을 사용해 air_temp와 humidity에 대해 선형 회귀 대치를 수행하고, 예측 변수로 year, latitude, sea_surface_temp를 사용한 다음 결과를 tao_imp에 할당하세요.