1. 학습
  2. /
  3. 강의
  4. /
  5. R에서 대치(Imputation)로 결측치 다루기

Connected

연습 문제

kNN 팁과 요령 I: 기증자 가중치 부여

자주 사용되는 kNN 대치 변형 중 하나는 이른바 거리 가중 집계를 사용합니다. 이는 결측값을 대체하기 위해 이웃들의 값을 집계할 때 가중평균을 사용하고, 각 이웃과의 거리의 역수를 가중치로 삼는다는 뜻이에요. 그 결과 더 가까운 이웃이 대치값에 더 큰 영향을 줍니다.

이 연습 문제에서는 tao 데이터에 거리 가중 집계를 적용해 대치해 보겠습니다. 이를 위해 kNN() 함수에 두 가지 인수를 추가로 전달하기만 하면 돼요. 함께 해볼까요?

지침

100 XP
  • VIM 패키지를 불러오세요.
  • 이웃의 집계를 위해 거리 가중 평균을 사용하여 kNN으로 humidity를 대치하세요. numFun과 weightDist 인수를 지정해야 합니다.
  • 결과를 확인하는 마진 플롯 코드는 이미 준비되어 있어요.