1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

kNN のコツとヒント I:ドナーの重み付け

kNN 補完のよく使われるバリエーションとして、距離加重集約と呼ばれる手法があります。これは、欠損値の代替値を得るために近傍点の値を集約する際、加重平均を使用し、各近傍点までの距離の逆数を重みとする方法です。その結果、より近い近傍点が補完値により大きな影響を与えます。

この演習では、tao データを補完しながら距離加重集約を適用します。kNN() 関数に追加の引数を2つ渡すだけで実現できます。さっそく試してみましょう。

指示

100 XP
  • VIM パッケージを読み込みます。
  • 近傍点の集約に距離加重平均を使用して、kNN で humidity を補完します。numFun と weightDist の引数を指定する必要があります。
  • 結果を確認するためのマージンプロットのコードはすでに用意されています。