1. 학습
  2. /
  3. 강의
  4. /
  5. Rでのデータクリーニング

Connected

연습 문제

欠損データの扱い

この演習では、cust_id と acct_amount の両方に欠損値が含まれる、別バージョンの accounts データを扱います。

銀行が保有するユニークな顧客数と、顧客が保有する平均額を把握したいとします。cust_id が欠損している行は役に立たないこと、そして平均的に acct_amount は inv_amount の5倍であることが分かっています。

この演習では、cust_id が欠損している accounts の行を削除し、ドメイン知識を用いて inv_amount の欠損値を補完します。dplyr と assertive は読み込まれており、accounts は利用可能です。

지침 1/4

undefined XP
    1
    2
    3
    4
  • 欠損した cust_id を持つ行を削除するように accounts をフィルタし、accounts_clean として保存します。