1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 결측치 다루기

Connected

연습 문제

simputation으로 데이터 보간하기

R에는 다양한 보간 패키지가 있습니다. 여기서는 보간을 간단하고 강력하게 수행할 수 있는 인터페이스를 제공하는 simputation 패키지에 집중하겠습니다.

좋은 보간 모델을 만드는 일은 매우 중요하지만, 마찬가지로 복잡한 주제입니다. 탄탄한 통계 모델을 만드는 것만큼이나 많은 요소가 필요하죠. 이 강의에서는 보간 결과를 어떻게 평가할지에 초점을 맞추겠습니다.

먼저, 지정한 선형 모델에 따라 값을 보간하는 impute_lm() 함수를 살펴보겠습니다.

이 연습 문제에서는 이전에 배운 평가 기법을 impute_lm()을 적용한 데이터에 사용해 보고, 이후 레슨에서 이 보간 방법을 바탕으로 더 확장해 보겠습니다.

지침

100 XP

oceanbuoys 데이터셋을 사용하세요:

  • wind_ew와 wind_ns를 사용해 humidity를 보간하고, add_label_shadow()로 결측치 여부를 기록하세요.
  • air_temp_c와 humidity의 보간값을 각각 x축과 y축에 두고, 색상은 any_missing()으로 지정해 시각화하세요.