1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 Python 的 ETL 和 ELT

Connected

道练习

使用 pandas 填充缺失值

在构建数据管道时,遇到缺失数据几乎是不可避免的。有时,您可能希望将这些记录从数据集中移除。但在其他情况下,您需要为缺失信息进行插补。本练习中,您将练习使用 pandas 为缺失的测试分数进行插补。

文件 "testing_scores.json" 中的数据已读入 DataFrame,并存储在变量 raw_testing_scores 中。此外,已将 pandas 以 pd 的名称导入。

说明 1 / 共 3 个

undefined XP
    1
    2
    3
  • 打印 raw_testing_scores DataFrame 的表头,观察其中的 NaN 值。