1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 시각화 개선하기

Connected

연습 문제

신뢰 구간에 주석 달기

여러분의 대기 오염 데이터 분석 실력은 전설적이라, 지금은 오하이오주 신시내티와 인디애나주 인디애나폴리스의 채용 제안을 저울질하고 있어요. 두 도시의 SO2 농도가 유의미하게 다른지, 더 구체적으로 어느 도시가 더 낮은지 확인하고 싶습니다. 이를 위해 여러 해에 걸쳐 두 도시의 SO2 값 차이(인디애나폴리스 - 신시내티, diffs_by_year로 제공)를 살펴보기로 했어요.

두 도시 간 차이에 대한 p-value만 확인하는 대신, 차이의 95% 신뢰 구간(lower, upper 열)을 보려고 합니다. 이렇게 하면 연도별 추세와 함께 차이의 크기까지 한눈에 파악할 수 있어요.

지침

100 XP
  • 신뢰 구간의 시작/끝 한계(lower, upper 열)를 plt.hlines()에 전달하세요.
  • 구간 두께를 5로 설정하세요.
  • plt.axvline()으로 차이가 0인 세로선을 그리세요.
  • 눈에 띄도록 영가설 기준선의 색을 'orangered'로 지정하세요.