1. 学ぶ
  2. /
  3. プロジェクト
  4. /
  5. Python으로 미국 인구조사 데이터 분석하기

Connected

演習

D 계산 함수 만들기

이질성 지수(Index of Dissimilarity)를 계산하려면 여러 단계가 필요하고 재사용성도 높아요. 이번 연습에서는 이전 연습에서 사용했던 dissimilarity 함수를 직접 만들어 보겠습니다. 함수의 입력 매개변수는 소지역(예: tract)의 DataFrame과 세 개의 열 이름이에요. 두 개는 각각 집단 A와 집단 B의 인구수 열이고, 하나는 상위 지역(예: 주 또는 대도시권)의 이름 또는 지리 식별자 열입니다.

참고로, 이질성 지수의 공식은 다음과 같아요.

$$D = \frac{1}{2}\sum{\left\lvert \frac{a}{A} - \frac{b}{B} \right\rvert}$$

pandas 는 평소와 같은 별칭으로 임포트되어 있습니다. 아래 코드에서 groupby 와 merge 는 이미 완료되어 있어요.

指示

100 XP
  • 공식에 따라 절댓값 기호 안의 식을 계산하세요: \(A\) 와 $B$의 열 이름은 매개변수 col_A 와 col_B 에 접미사 "_sum" 을 붙여서 만듭니다.
  • 단일 열에 대해 sum 메서드를 호출하면 시리즈가 반환되므로, to_frame() 메서드로 시리즈를 DataFrame으로 변환하세요.
  • tracts 에서 새 함수를 테스트하세요: MSA 이름별로 White-Black 이질성을 계산하세요.