1. 学习
  2. /
  3. 课程
  4. /
  5. 使用 pandas 进行数据处理

Connected

练习

子集化行

数据科学的重要部分是找出数据集中哪些部分值得关注。最简单的方法之一是选出满足特定条件的行子集。这也常被称为"过滤行"或"选择行"。

对 DataFrame 进行子集化的方法有很多。最常见的是使用关系运算符为每一行返回 True 或 False,然后把结果放进方括号中。

dogs[dogs["height_cm"] > 60]
dogs[dogs["color"] == "tan"]

您也可以同时按多个条件过滤,使用"按位与"运算符 &。

dogs[(dogs["height_cm"] > 60) & (dogs["color"] == "tan")]

homelessness 已可用,并且已将 pandas 以 pd 导入。

说明 1/3

undefined XP
  • 1

    将 homelessness 中 individuals 数量大于 10,000 的记录过滤出来,赋值给 ind_gt_10k。查看打印结果。

  • 2

    将 homelessness 中 USA Census 的 region 为 "Mountain" 的记录过滤出来,赋值给 mountain_reg。查看打印结果。

  • 3

    将 homelessness 中 family_members 少于 1,000 且 region 为 "Pacific" 的记录过滤出来,赋值给 fam_lt_1k_pac。查看打印结果。