1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでの欠損データの扱い方

Connected

演習

欠損の度数分布表を作る

先ほど計算した欠損の要約では、ケースと変数ごとの欠損観測の数と割合がわかりました。

欠損を要約する別の方法として、各変数や各ケースについて、欠損が 0、1、2、3 件…のように現れる回数を表にまとめるやり方があります。

この演習では、miss_var_table() と miss_case_table() を使って各変数と各ケースの欠損数を表にし、さらに dplyr の group_by 演算子と組み合わせて、データセット内のグループ変数ごと(ここでは Month など)に要約を比較していきます。

指示

100 XP

airquality データセットについて、次を行ってください。

  • miss_var_table() を使って、各変数の欠損を表にまとめます。
  • miss_case_table() を使って、各ケース(行)の欠損を表にまとめます。
  • これらの表を dplyr の group_by() と組み合わせて、各 Month ごとに変数別・ケース別の表を作成します。