1. 학습
  2. /
  3. 프로젝트
  4. /
  5. R로 분석하는 미국 인구조사 데이터

Connected

연습 문제

변수 다시 코딩하기와 그룹 합계 계산

tidyverse의 핵심 패키지 중 하나인 dplyr에는 데이터 정리를 위한 다양한 함수가 포함되어 있어요. 이 기능을 통해 데이터셋의 값을 다시 코딩하고, 데이터셋 내 그룹을 정의하며, 각 그룹에 대해 계산을 수행할 수 있습니다. 이러한 작업은 보통 %>% 연산자로 표시되는 파이프 안에서 이루어집니다.

이 연습 문제에서는 tidyverse 워크플로 안에서 ACS 데이터를 다뤄 보겠습니다. ACS 표 B19001에서 가구 중위소득 변수가 $35,000 미만, $35,000 이상 $75,000 이하, $75,000 초과인 경우를 구분해 보세요. 그런 다음 워싱턴주의 카운티별로 각 그룹에 속하는 가구 수를 집계합니다.

지침

100 XP
  • 변수 값이 "B19001_001"와 같은 행은 전체 가구 수를 나타내므로 제외하세요.
  • case_when() 함수를 사용해 다시 코딩한 그룹을 정의할 incgroup 열을 생성하세요.
  • group_by() 함수를 사용해 데이터셋을 카운티 이름과 소득 그룹별로 그룹화하세요.
  • 마지막으로 summarize() 함수를 사용해 카운티별 그룹 합계를 집계하고, 결과를 확인하세요.