1. 学ぶ
  2. /
  3. コース
  4. /
  5. dplyr で行うデータ操作

Connected

演習

正規化した人気度の変化を可視化する

いくつかの名前を選び、それぞれのピークに対する比率として計算しました。これは名前を「正規化」する一種の方法で、名前全体の人気度そのものではなく、各名前の中での相対的な変化に注目します。

この演習では、各名前の正規化された人気度を可視化します。前の演習で作成したnames_normalizedが用意されています。

names_normalized <- babynames %>%
                     group_by(name) %>%
                     mutate(name_total = sum(number),
                            name_max = max(number)) %>%
                     ungroup() %>%
                     mutate(fraction_max = number / name_max)

指示

100 XP
  • names_normalizedテーブルをフィルタして、Steven、Thomas、Matthewの3つの名前に絞り込みます。
  • names_filteredから折れ線グラフを作成し、時間に対するfraction_maxを、nameで色分けして可視化します。