1. 学习
  2. /
  3. 课程
  4. /
  5. 使用 pandas 进行数据处理

Connected

练习

设置多级索引

索引也可以由多列构成,形成一个"多级索引"(有时称为"层级索引")。这样做是有取舍的。

好处是,多级索引更符合对嵌套类别变量的思考方式。例如,在临床试验中,您可能有对照组和实验组。每位受试者都隶属于其中一组,我们可以说受试者嵌套在实验组内。类似地,在气温数据集中,城市位于国家之内,因此可以说城市嵌套在国家之内。

主要的不足在于,操作索引的代码与操作列的代码不同,您需要学习两套语法,并且随时了解数据是如何表示的。

已将 pandas 以 pd 导入。temperatures 可用。

说明

100 XP
  • 将 temperatures 的索引设置为 "country" 和 "city" 两列,并赋值给 temperatures_ind。
  • 指定两个要保留的 国家/城市 组合:"Brazil"/"Rio De Janeiro" 和 "Pakistan"/"Lahore",赋值给 rows_to_keep。
  • 使用 .loc[] 打印并按 rows_to_keep 对 temperatures_ind 进行子集筛选。