1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでのデータクリーニング

Connected

演習

欠損データの可視化

欠損データへの対応は、データサイエンスで最も一般的な作業のひとつです。欠損にはさまざまな種類があり、対処法もまた複数あります。

新規・既存顧客の預かり資産額と投資額を含む accounts データフレームの新しいバージョンを受け取りました。ただし、inv_amount が欠損している行があります。

25歳未満の多くの顧客はまだ投資口座を持っていないことが分かっており、これが欠損の要因になっているのではと考えています。dplyr と visdat パッケージは読み込まれており、accounts は利用可能です。

指示1 / 4

undefined XP
    1
    2
    3
    4
  • visdat パッケージの関数を使って、accounts の列ごとの欠損値を可視化してください。