1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

연습 문제

Hot-deck 요령 II: 상관된 변수로 정렬하기

Hot-deck 보간의 성능을 높이는 또 다른 요령은, 보간하려는 변수와 상관된 변수로 데이터를 정렬하는 것입니다.

예를 들어, 방금까지 그린 여러 마진 플롯에서 공기 온도는 해수면 온도와 강하게 상관되어 있다는 것을 확인했을 거예요. 이는 매우 자연스러운 결과죠. 이 지식을 활용해 hot-deck 보간을 개선할 수 있어요. 먼저 데이터를 sea_surface_temp로 정렬하면, 보간된 각 air_temp 값은 유사한 sea_surface_temp를 가진 기증자(donor)에서 가져오게 됩니다. 실제로 어떻게 동작하는지 살펴보겠습니다!

지침

100 XP
  • tao 데이터에서 sea_surface_temp로 정렬해 air_temp의 결측값을 hot-deck 보간하고, 결과를 tao_imp에 할당하세요.
  • air_temp 대 sea_surface_temp 마진 플롯을 만드세요.