1. Learn
  2. /
  3. 课程
  4. /
  5. Python 数据清洗

Connected

道练习

顺藤摸"资"

在本练习中,您将使用另一个版本的 banking DataFrame,其中 cust_id 列和 acct_amount 列都包含缺失值。

您希望分析银行拥有的唯一客户数量、客户持有金额的平均值等。您知道,缺少 cust_id 的行对分析没有帮助,并且通常 acct_amount 的平均水平大约是 inv_amount 的 5 倍。

在本练习中,您将删除 banking 中 cust_id 缺失的行,并基于领域知识对缺失的 acct_amount 进行填补。

说明

100 XP
  • 使用 .dropna() 删除 banking 中 cust_id 列的缺失值,将结果保存为 banking_fullid。
  • 使用 inv_amount 估算 banking_fullid 的账户金额,令其等于 inv_amount * 5,并将结果赋给 acct_imp。
  • 使用 .fillna() 将 banking_fullid 中 acct_amount 的缺失值用新创建的 acct_imp 进行填补。