1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

MAR の t 検定:データの準備

前の演習で欠損データのメカニズムを分類できましたね。3 つのメカニズムの中でも、MAR は特に検出が重要です。多くの補完手法がデータは MAR であることを前提としているためです。この演習では、MAR の検定に焦点を当てます。

ここでもおなじみの biopics データを使います。目標は、earnings の欠損値の数が対象者の性別によって異なるかどうかを検定することです。この演習では、t 検定のためのデータ準備のみを行います。まず、earnings の欠損を示すダミー変数を作成します。次に、データを性別でフィルタリングし、ダミー変数を取り出すことで、性別ごとに分割します。フィルタリングの際は、コンソールで biopics の head() を出力して性別変数を確認しておくと便利です。

指示

100 XP
  • biopics に missing_earnings という変数を追加してください。earnings が欠損している場合は TRUE、そうでない場合は FALSE となるようにします。
  • 男性の missing_earnings の値ベクトルを作成し、missing_earnings_males に代入してください。
  • 女性の missing_earnings の値ベクトルを作成し、missing_earnings_females に代入してください。