1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

연습 문제

평균 대치로 온도 채우기

평균 대치는 신중해야 해요. 평균으로 대치하려는 변수가 다른 변수들과 상관되어 있다면, 대치값 때문에 그 상관관계가 깨질 수 있어요. 이전 연습 문제에서 air_temp 변수를 분석할 때도 이런 위험 신호를 보셨죠.

이 걱정이 타당한지 확인하기 위해, 이번 연습에서는 air_temp에 평균 대치를 수행하고, 동시에 값이 대치된 위치를 표시하는 이진 지표도 만들 거예요. 이는 다음 연습 문제에서 대치 성능을 평가할 때 유용하게 쓰일 거예요. 이제 누락된 값을 채워 봅시다!

지침

100 XP
  • tao를 수정하는 파이프라인에서, air_temp가 누락되었으면 TRUE, 그렇지 않으면 FALSE인 새 변수 air_temp_imp를 만드세요.
  • 같은 파이프라인의 다음 단계에서, air_temp가 누락된 경우에만 그 변수의 평균값으로 air_temp를 덮어쓰고, 그렇지 않은 경우는 그대로 두세요. 결과를 tao_imp에 할당하세요.