섹터별 시가총액 중앙값

집계 데이터(Aggregate data)는 여러 측정을 결합한 데이터예요. 영상에서 배운 것처럼 .groupby() 함수는 특정 범주로 데이터를 집계하는 데 유용합니다.

앞서 시가총액 데이터에 큰 이상치가 있음을 보셨죠. 각 섹터별 기업의 시장가치를 더 견고하게 요약하기 위해, 섹터별 시가총액 중앙값을 계산해 보겠습니다. pandas는 pd로, matplotlib.pyplot은 plt로 임포트되어 있으며, NYSE 상장 종목 목록이 DataFrame nyse로 작업 공간에 준비되어 있습니다.

.info()로 nyse를 확인하세요.
브로드캐스팅과 .div()를 사용해, 시가총액을 백만 달러(USD) 단위로 담는 새 열 market_cap_m을 만드세요.
.drop()으로 'Market Capitalization' 열을 제거하세요.
'Sector'를 기준으로 데이터를 묶도록 nyse에 .groupby() 메서드를 적용하세요.
market_cap_m 열의 중앙값을 계산해 median_mcap_by_sector로 저장하세요.
결과를 가로 막대 차트로 그리되 제목은 'NYSE - Median Market Capitalization'으로 하세요. 축 라벨은 plt.xlabel()과 'USD mn'을 사용해 추가하세요.
결과를 표시하세요.

연습 문제

섹터별 시가총액 중앙값

지침

.css-6su6fj{-webkit-flex-shrink:0;-ms-flex-negative:0;flex-shrink:0;}연습 문제

지침

연습 문제