1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 dplyr 进行数据处理

Connected

道练习

同时使用 summarize、slice_max 和 count

在本章中,您学习了 6 个与聚合相关的 dplyr 动词:count()、group_by()、summarize()、ungroup()、slice_max() 和 slice_min()。在本练习中,您将把它们组合起来回答一个问题:

有多少个州在大都市区(metro)居住的人数多于非大都市区(non-metro)?

回顾一下,metro 列的取值有两个:"Metro"(高密度城市区域)或 "Nonmetro"(郊区和乡村区域)。

counties_selected <- counties %>%
  select(state, metro, population)

说明 1/3

undefined XP
  • 1

    对每个 state 与 metro 的组合,计算总人口并命名为 total_pop。

  • 2

    从每个州提取人口最多的一行,结果将是 Metro 或 Nonmetro。

  • 3

    先取消分组,然后统计 Metro 或 Nonmetro 出现的次数,以查看有多少个州在这些区域居住的人更多。