1. Learn
  2. /
  3. 课程
  4. /
  5. R 中的数据清洗

Connected

道练习

处理缺失数据

在本练习中,您将使用另一个版本的 accounts 数据,其中 cust_id 和 acct_amount 列都包含缺失值。

您想要统计银行拥有的唯一客户数量,以及客户持有金额的平均值。您知道缺少 cust_id 的行没有帮助,而且平均来说,acct_amount 通常是 inv_amount 的 5 倍。

本练习中,您将删除 accounts 中缺少 cust_id 的行,并结合领域知识对缺失的 inv_amount 进行填补。已加载 dplyr 和 assertive,并已提供 accounts。

说明 1 / 共 4 个

undefined XP
    1
    2
    3
    4
  • 过滤 accounts,去除缺少 cust_id 的行,并保存为 accounts_clean。