1. Learn
  2. /
  3. 课程
  4. /
  5. Python 数据清洗

Connected

道练习

我们的数据完整性如何?

新的数据已合并进 banking 数据框,其中包含 inv_amount 列中的投资如何分配到四个不同基金 A、B、C 和 D 的详细信息。

此外,客户的年龄和生日分别存储在 age 和 birth_date 列中。

您想了解不同年龄段客户的投资方式。不过在分析之前,您希望先确认数据是否正确。您将通过对 inv_amount 和 age 与不同基金的投资金额以及客户生日进行跨字段校验来完成这一点。 pandas 和 datetime 已分别以 pd 和 dt 导入。

说明 1/2

undefined XP
  • 1
    • 找到 banking 中 fund_columns 各列按行求和等于 inv_amount 列的那些行。
    • 将 inv_amount 一致的 banking 行保存到 consistent_inv,将不一致的保存到 inconsistent_inv。
  • 2
    • 将今天的日期存入 today,手动计算客户年龄并存入 ages_manual。
    • 找到 banking 中 age 列等于 ages_manual 的所有行,然后将 banking 过滤为 consistent_ages 和 inconsistent_ages。