1. 학습
  2. /
  3. 강의
  4. /
  5. dplyr로 데이터 조작하기

Connected

연습 문제

summarize, slice_max, count 함께 사용하기

이번 장에서는 집계에 관련된 여섯 가지 dplyr 동사를 배웠어요: count(), group_by(), summarize(), ungroup(), slice_max(), slice_min(). 이번 연습에서는 이 함수들을 조합해 다음 질문에 답해 보겠습니다:

도심권(metro) 인구가 비도심권(non-metro) 인구보다 더 많은 주는 몇 개일까요?

metro 열에는 "Metro"(고밀도 도시 지역) 또는 "Nonmetro"(교외 및 농촌 지역) 두 값 중 하나가 들어 있음을 기억하세요.

counties_selected <- counties %>%
  select(state, metro, population)

지침 1/3

undefined XP
  • 1

    state와 metro의 각 조합에 대해 총인구를 total_pop으로 구하세요.

  • 2

    각 주에서 가장 인구가 많은 행을 추출하세요. 이 값은 Metro 또는 Nonmetro 중 하나예요.

  • 3

    그룹을 해제한 뒤, Metro와 Nonmetro가 각각 몇 번 나타나는지 세어 해당 지역에 더 많은 사람이 사는 주의 수를 확인하세요.