1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 금융 데이터 가져오기와 관리

Connected

연습 문제

섹터와 IPO 연도별로 여러 지표 계산하기

seaborn의 pointplot() 함수는 범주형 변수의 서로 다른 수준에 대해 수치형 변수의 요약 통계를 비교할 수 있게 해줘요:

seaborn.pointplot(x=None, y=None, hue=None, data=None, ...)

영상에서는 IPO(범주형 변수)가 2000년 이전(첫 번째 수준)과 이후(두 번째 수준)에 발생했는지에 따라 시가총액(수치형 변수)을 시각화하는 방법을 보셨습니다.

이 연습 문제에서는 95번째 분위수를 초과하는 이상치를 제외한 뒤, 2000년 이후 각 연도별로 NYSE와 NASDAQ의 평균 시가총액을 비교해 볼 거예요. pandas는 pd로, matplotlib.pyplot은 plt로 임포트되어 있으며, 참조 열 'Exchange'를 가진 listings DataFrame이 워크스페이스에 준비되어 있어요.

지침

100 XP
  • seaborn을 sns로 임포트하세요.
  • 모든 거래소 중 'amex'를 제외하고, 2000년 이후 IPO가 있었던 기업만 남기도록 listings를 필터링하세요.
  • 'IPO Year' 열의 데이터를 정수형으로 변환하세요.
  • 시가총액을 백만 달러(USD) 단위로 표현하는 market_cap_m 열을 만드세요.
  • market_cap_m에서 95번째 분위수를 초과하는 값을 제외하세요.
  • listings에 대해 pointplot을 생성하되, x에는 'IPO Year', y에는 'market_cap_m', hue에는 'Exchange'를 사용하세요. xticks를 45도 회전한 후 결과를 표시하세요.