1. 学ぶ
  2. /
  3. コース
  4. /
  5. dplyr で行うデータ操作

Connected

演習

各名前ごとの合計と最大値を追加する

動画では、年ごとにグループ化して mutate() を使い、その年の合計を追加する方法を学びました。

この演習では、別の興味深い指標で正規化します。各名前の値を「その名前の最大値」で割ります。つまり、すべての名前でピークが 1 になります。

新しい列を追加した後も、結果は名前でグループ化されたままです。これにより 48,000 のグループに分かれ、実際には後続の mutate などの処理が遅くなります。

指示1 / 2

undefined XP
    1
    2
  • グループ化した mutate を使って 2 つの列を追加します。
    • name_total: データセット全体で、その名前で生まれた赤ちゃんの人数の合計。
    • name_max: どの年でもよいので、その名前で生まれた赤ちゃんの人数の最大値。