1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

変数ごとの補完誤差

前の演習では、missForest の出力から推定補完誤差を取り出しました。その結果、次の2つの値が得られました。

  • 連続変数全体の正規化二乗平均平方根誤差(NRMSE)
  • カテゴリ変数全体の誤分類率(PFC)

ただし、補完モデルがある連続変数には優れた精度を示す一方、別の変数には低い精度しか出ないという状況も十分あり得ます。そのような場合を診断するには、missForest に変数ごとの誤差推定値を出力させれば十分です。これは variablewise 引数を TRUE に設定することで実現できます。

biopics データと missForest パッケージはすでに読み込まれています。誤差をより詳しく確認してみましょう。

指示1 / 3

undefined XP
    1
    2
    3
  • missForest を使って biopics データを補完し、変数ごとの誤差推定値が計算されるようにしましょう。