1. Lära sig
  2. /
  3. Courses
  4. /
  5. Python으로 금융 데이터 가져오기와 관리

Connected

exercise

섹터별 시가총액 중앙값

집계 데이터(Aggregate data)는 여러 측정을 결합한 데이터예요. 영상에서 배운 것처럼 .groupby() 함수는 특정 범주로 데이터를 집계하는 데 유용합니다.

앞서 시가총액 데이터에 큰 이상치가 있음을 보셨죠. 각 섹터별 기업의 시장가치를 더 견고하게 요약하기 위해, 섹터별 시가총액 중앙값을 계산해 보겠습니다. pandas는 pd로, matplotlib.pyplot은 plt로 임포트되어 있으며, NYSE 상장 종목 목록이 DataFrame nyse로 작업 공간에 준비되어 있습니다.

Instruktioner

100 XP
  • .info()로 nyse를 확인하세요.
  • 브로드캐스팅과 .div()를 사용해, 시가총액을 백만 달러(USD) 단위로 담는 새 열 market_cap_m을 만드세요.
  • .drop()으로 'Market Capitalization' 열을 제거하세요.
  • 'Sector'를 기준으로 데이터를 묶도록 nyse에 .groupby() 메서드를 적용하세요.
  • market_cap_m 열의 중앙값을 계산해 median_mcap_by_sector로 저장하세요.
  • 결과를 가로 막대 차트로 그리되 제목은 'NYSE - Median Market Capitalization'으로 하세요. 축 라벨은 plt.xlabel()과 'USD mn'을 사용해 추가하세요.
  • 결과를 표시하세요.