1. Learn
  2. /
  3. 课程
  4. /
  5. 使用 dplyr 进行数据处理

Connected

道练习

名字热度最大跃升

之前,您添加了一个 ratio 列,用于表示某个婴儿名字在相邻年份之间的频率之比,以描述名字受欢迎度的变化。现在,您将查看该数据的一个子集 babynames_ratios_filtered,进一步找出在相邻年份中人气跃升幅度最大的名字。

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

说明

100 XP
  • 对于数据中的每个名字,仅保留具有最大 ratio 的观测(年份);注意数据已按 name 分组。
  • 将 ratio 列按降序排序。
  • 进一步筛选 babynames_ratios_filtered,仅显示 fraction 列大于或等于 0.001 的结果。