1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

線形回帰による補完

変数間の関係を、専門知識や過去の研究、あるいは常識にもとづいて説明できる場合があります。そのような場合、モデルベースの補完は非常に有効な手法です。変数どうしがどのように影響し合うかという仮定を踏まえながら、統計モデルを自分で指定して各変数を補完できます。

連続変数に対してよく使われるモデルの一つが線形回帰です。ただし、線形の関係に限定される必要はありません。予測変数として変数の二乗値や対数値を含めることも可能です。この演習では、simputation パッケージを使って tao データに単回帰補完を実行し、結果を分析します。さっそく試してみましょう!

指示1 / 4

undefined XP
    1
    2
    3
    4
  • simputation パッケージを読み込みます。
  • impute_lm() を使って、year、latitude、sea_surface_temp を予測変数として、air_temp と humidity の線形回帰補完を実行し、結果を tao_imp に代入します。