1. 学ぶ
  2. /
  3. コース
  4. /
  5. dplyr で行うデータ操作

Connected

演習

summarize、slice_max、count を組み合わせて使う

この章では、集約に関わる 6 つの dplyr 動詞、count()、group_by()、summarize()、ungroup()、slice_max()、slice_min() の使い方を学びました。この演習では、これらを組み合わせて次の問いに答えます。

「メトロ地域に住む人がノンメトロ地域より多い州はいくつありますか?」

metro 列には、人口密度の高い都市部を表す "Metro" と、郊外や地方を表す "Nonmetro" のいずれかの値が入っていることを思い出してください。

counties_selected <- counties %>%
  select(state, metro, population)

指示1 / 3

undefined XP
  • 1

    state と metro の各組み合わせについて、合計人口を total_pop として求めてください。

  • 2

    各州から最も人口の多い行を取り出します。これは Metro か Nonmetro のどちらかになります。

  • 3

    グループ化を解除してから、Metro と Nonmetro がそれぞれ何回現れるかを数え、どちらの地域に住む人が多い州がいくつあるかを確認します。