1. 学ぶ
  2. /
  3. コース
  4. /
  5. R による欠損データの補完処理

Connected

演習

ホットデック補完のコツ II:相関変数による並べ替え

ホットデック補完の精度を高めるもう一つのコツは、補完したい変数と相関のある変数でデータを並べ替えることです。

たとえば、これまで作成したマージンプロットでは、気温と海面水温が強く相関していることが確認できました。これは直感的にも理にかなっています。この知識を活用して、ホットデック補完を改善しましょう。sea_surface_temp でデータを並べ替えてから補完を行うと、各 air_temp の補完値は sea_surface_temp が近いドナーから取得されます。実際にどのように機能するか、試してみましょう。

指示

100 XP
  • tao データの air_temp の欠損値を、sea_surface_temp で並べ替えてからホットデック補完し、結果を tao_imp に代入しましょう。
  • air_temp と sea_surface_temp のマージンプロットを作成しましょう。