1. 学ぶ
  2. /
  3. コース
  4. /
  5. Rでの欠損データの扱い方

Connected

演習

はじめての欠損データ可視化

データのどこに欠損値があるかを把握するのは難しいことがあります。ここで可視化が大いに役立ちます。

vis_miss() 関数は、データ内の欠損の概要を可視化します。行を欠損パターンでクラスタリングする cluster = TRUE、列を欠損の多い順から少ない順へ並べ替える sort_miss = TRUE といったオプションもあります。

指示

100 XP

naniar の riskfactors データセットを使って、次を行ってください。

  • vis_miss() でデータの欠損状況を可視化します。
  • vis_miss() に cluster = TRUE を指定して、欠損のクラスタを探索します。
  • vis_miss() で sort_miss を使って、列を欠損の多い順に並べ替えます。