1. Learn
  2. /
  3. 课程
  4. /
  5. Python 工具箱

Connected

道练习

编写迭代器以分块加载数据(5)

来到最后一步。您已经学会了如何按块处理大型数据集。在本练习中,您将把处理数据的所有代码封装到一个函数中,这样就能复用,而不必一遍遍重写。

您将定义函数 plot_pop(),它接收两个参数:要处理的文件名,以及您希望在数据集中处理的国家代码。

由于之前练习中编写的所有代码都会放进 plot_pop(),因此只需调用该函数就会完成以下操作:

  • 按块加载文件,
  • 创建新的城市人口数列,
  • 绘制城市人口数据。

这看起来工作不少,但这个函数让您能方便地针对任意文件和国家代码重复相同流程并完成可视化!

您将使用当前目录中的 'ind_pop_data.csv' 数据。pandas 和 matplotlib.pyplot 已分别以 pd 和 plt 导入,供您使用。

完成后,请花点时间看看图表,回顾一下您刚掌握的新技能。学习并未止步于此!如果您喜欢这个数据集,您还可以在 Kaggle 上继续探索其预处理版本。

说明

100 XP
  • 定义函数 plot_pop(),包含两个参数:第一个是待处理文件的 filename,第二个是数据集中待处理国家的 country_code。
  • 调用 plot_pop(),处理文件 'ind_pop_data.csv' 中国家代码为 'CEB' 的数据。
  • 调用 plot_pop(),处理文件 'ind_pop_data.csv' 中国家代码为 'ARB' 的数据。