1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

デフォルトモデルの選択

MICEは、データ内の各変数に対して個別の補完モデルを作成します。どのモデルが使われるかは、対象変数の型によって決まります。よく使われる設定方法として、4種類の変数型それぞれにデフォルトモデルを指定する方法があります。

これを行うには、mice() に defaultMethod 引数を渡します。この引数は長さ4のベクトルで、以下の変数型に対するデフォルトの補完手法を順に指定します。

  1. 連続変数、
  2. 二値変数、
  3. カテゴリ変数(順序なし因子)、
  4. 因子変数(順序あり因子)。

この演習では、mice のドキュメントを参照して利用可能な手法の一覧を確認し、アルゴリズムに使用させたい手法を選びましょう。モデルの選択を実践してみましょう!

指示

100 XP
  • ?mice で表示されるRDocumentationには、各手法のキーワードが記載された表があります。
  • 以下のデフォルト手法を順番どおりに指定して、mice() で biopics データを補完しましょう。指定する手法は、分類・回帰木、線形判別分析、予測平均マッチング、比例オッズモデルの順です。
  • biopics_multiimp を出力して、どの変数にどの手法が使われたかを確認しましょう。