1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 금융 데이터 가져오기와 관리

Connected

연습 문제

전 세계 소득 분포의 데사일

데사일(decile)은 특정 데이터셋의 분포를 10개 구간으로 나눠 얻는 특수한 분위수예요. 데사일(및 다른 종류의 분위수)은 다음과 같은 numpy 함수를 .quantile()에 제공해 만들 수 있어요. 여기서 start는 구간의 시작값(포함), stop은 구간의 끝값(제외), step은 인접한 두 값 사이의 간격을 의미합니다:

np.arange(start, stop, step)

영상에서 보셨듯이, 표준 막대 그래프는 데이터 분포를 시각화하는 데 매우 유용해요. .plot()에 kind='bar' 인수를 추가하면 막대 그래프를 만들 수 있습니다.

이제 배운 내용을 활용해 데사일로 요약된 소득 분포를 그려 보세요! pandas는 pd, numpy는 np, matplotlib.pyplot은 plt로 임포트되어 있으며, 이전 연습 문제의 income DataFrame이 작업 공간에 준비되어 있습니다.

지침

100 XP
  • np.arange()를 사용해 10%에서 90%까지 10% 간격의 백분율을 생성하고, 결과를 quantiles에 할당한 뒤 출력하세요.
  • quantiles와 .quantile()을 사용해 1인당 소득의 데사일을 deciles로 계산하고, 결과를 출력하세요.
  • 결과를 막대 차트로 그린 뒤 plt.tight_layout()과 함께 표시하세요. 제목은 'Global Income per Capita - Deciles'로 지정하세요.