1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでの欠損データの扱い方

Connected

演習

散布図でインプテーションした値を可視化する

ここでは、第3章で見た geom_miss_point() を使ったプロットのひとつを再現してみます。

そのために、データのレンジよりも下側に値をインプテーションします。これはデータを探索するための特殊なインプテーションです。今回のインプテーションは、私たちが練習すべき「欠損値を追跡する方法」を示すためのものです。データのレンジより下にインプテーションするには、impute_below_all() 関数を使います。

指示

100 XP

oceanbuoys データを使って、次を行ってください。

  • bind_shadow()、impute_below_all()、add_label_shadow() を用いて、欠損値をインプテーションし、同時に追跡します。
  • x軸に風、y軸に気温を取り、air_temp_c_NA で欠損している気温を色分けして、欠損状況を可視化します。
  • x軸に湿度、y軸に気温を取り、変数 any_missing を使って、いずれかが欠損しているケースを色分けして可視化します。