1. เรียนรู้
  2. /
  3. Courses
  4. /
  5. dplyr で行うデータ操作

Connected

Exercises

名前の人気が大きく跳ね上がった年

これまでに、ある名前の人気の変化を表すために、連続する年どうしの出現頻度の比を示す ratio 列を追加しました。ここでは、そのデータの一部である babynames_ratios_filtered を使い、連続する年で人気が最も大きく跳ね上がった名前に注目していきます。

babynames_ratios_filtered <- babynames_fraction %>%
                     arrange(name, year) %>%
                     group_by(name) %>%
                     mutate(ratio = fraction / lag(fraction)) %>%
                     filter(fraction >= 0.00001)

คำแนะนำ

100 XP
  • 各名前ごとに、ratio が最大となる観測(年)だけを残します。データはすでに name でグループ化されています。
  • ratio 列を降順に並べ替えます。
  • babynames_ratios_filtered をさらに絞り込み、fraction 列が 0.001 以上の結果のみを表示します。