1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでの欠損データの扱い方

Connected

演習

代入値を評価する:スケール

平均での代入は、箱ひげ図で比較するとそれほど悪く見えないかもしれませんが、データのばらつきを把握することが重要です。だからこそ、代入後の値のスケールや広がりが、元のデータと比べてどう変化しているかを確認することが大切です。

代入値のスケールが適切かどうかを評価する一つの方法は、散布図を使って値が妥当な範囲にあるかどうかを探索することです。

指示

100 XP

すでに代入を行ったデータ ocean_imp_mean を使って、次を行います。

  • 散布図で、気温(x軸)と湿度(y軸)の代入結果を確認し、color = any_missing を指定して色分けしてください。
  • さらに、この可視化を年ごとのファセットで拡張してください。