1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

近傍数の選び方

k近傍法(kNN)補完は、欠損値を含む観測値に最も類似した k 個の観測値(近傍)をもとに、欠損値を補完する手法です。考慮する近傍の数 k は、事前に決めておく必要があります。

k をどのように選べばよいでしょうか。一つの方法は、異なる値を試して、補完済みデータと観測済みデータの関係にどう影響するかを確かめることです。

ここでは、tao データの humidity を3種類の k の値でそれぞれ補完し、補完値が humidity と sea_surface_temp の関係にどのように当てはまるかを確認しましょう。

指示1 / 3

undefined XP
  • 1
    • 近傍数30でkNN補完を使って humidity を補完し、sea_surface_temp と humidity の marginplot() を描画してください。
  • 2
    • 近傍数15でkNN補完を使って humidity を補完し、sea_surface_temp と humidity のマージンプロットを描画してください。
  • 3
    • 近傍数5でkNN補完を使って humidity を補完し、sea_surface_temp と humidity のマージンプロットを描画してください。