1. 학습
  2. /
  3. 강의
  4. /
  5. R로 배우는 범주형 데이터 추론

Connected

연습 문제

첫 자릿수 추출 I

유권자 부정 의혹을 살펴보기 위해, 먼저 총 투표수의 첫 자릿수를 담은 새 열을 만들어 보세요. 이를 위해 get_first()라는 사용자 정의 함수를 제공해 드렸습니다. 이 함수의 핵심은 substr()로, 문자열에서 지정한 부분(부분 문자열)을 추출합니다.

첫 자릿수만 담은 새 변수를 만든 뒤, 막대 그래프를 그려 Benford의 법칙을 얼마나 잘 따르는지 감을 잡을 수 있어요.

지침

100 XP
  • 먼저 get_first()가 어떻게 동작하는지 확인해 보세요. 함수 이름만(괄호 없이) 입력하면 됩니다. substr()의 출력을 요리해서 팩터로 바꿔 주는 것이 전부예요.
  • iran 데이터 프레임에 도시별 총 투표수의 첫 자릿수를 담는 first_digit 열을 mutate로 추가하세요.
  • get_first()가 제대로 작동했는지 확인하세요. iran 데이터에서 total_votes_cast와 first_digit 열만 select해 화면에 출력하세요.
  • 첫 자릿수의 분포를 시각화하는 막대 그래프를 만드세요.