1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでの欠損データの扱い方

Connected

演習

欠損値はいくつありますか?

新しいデータセットで最初に確認したいことのひとつは、欠損値があるかどうか、そしていくつあるかです。

are_na() を使って欠損値を数えることもできますが、欠損を数える最も効率的な方法は n_miss() 関数を使うことです。これにより、データ内の欠損値の合計数がわかります。

次に、pct_miss 関数を使うとデータ内の欠損値の割合を求められます。これは、データにおける欠損値のパーセンテージを示します。

さらに、これらの補集合として、n_complete と pct_complete を使うと、完全な値がいくつあるか、その割合も求められます。

指示

100 XP

身長と体重の例データフレーム dat_hw を使って、次を行ってください。

  • データフレーム dat_hw に n_miss() を使い、データフレーム内の欠損値の合計数を数えます。
  • 変数 dat_hw$weight に n_miss() を使い、その変数内の欠損値の合計数を数えます。
  • 同様に、prop_miss()、n_complete()、prop_complete() を使って、欠損の割合、そしてデータフレームおよび各変数における完全な値の数と割合を取得します。