1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

気温の平均代入

平均代入(mean imputation)にはリスクが伴う場合があります。平均代入を行う変数が他の変数と相関している場合、代入後の値によってその相関が失われてしまう可能性があります。前の演習で air_temp 変数を分析したときにも、その兆候が見られました。

この懸念が実際に当てはまるかどうかを確かめるため、この演習では air_temp に平均代入を行い、同時にどの値が代入されたかを示す2値インジケーターを作成します。このインジケーターは次の演習で代入の精度を評価する際に役立ちます。さっそく欠損値を埋めましょう!

指示

100 XP
  • tao を変換するパイプラインの中で、air_temp が欠損している場合は TRUE、そうでない場合は FALSE となる新しい変数 air_temp_imp を作成してください。
  • 同じパイプラインの後半で、air_temp が欠損している箇所はその平均値で上書きし、欠損していない箇所はそのままにして、結果を tao_imp に代入してください。