1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 데이터 시각화 개선하기

Connected

연습 문제

기본 신뢰구간

아이오와주 디모인에 있는 한 불꽃놀이 제조사의 데이터 사이언티스트라고 가정해 볼게요. 시에 제출할 자료를 준비해야 하는데, 귀사의 대규모 불꽃놀이 쇼가 도시 대기에 해를 끼치지 않았다는 점을 입증해야 합니다. 이를 위해 7월 4일 이후 일주일 동안의 오염물질 평균 농도를 확인하고, 가장 최근 쇼 이후의 측정값과 비교합니다. 평균값 주변의 신뢰구간을 보여 주면, 최근 측정값이 정상 범위 안에 충분히 포함된다는 근거를 제시할 수 있어요.

이 데이터는 각 오염물질을 한 행으로 갖는 average_ests로 로드되어 있습니다.

지침

100 XP
  • 95% 신뢰구간의 하한과 상한 경계를 생성하세요:

    • 추정치의 'mean'에서 표준 오차('std_err')의 1.96배를 빼서 하한 경계를 만드세요.
    • 추정치의 'mean'에 표준 오차('std_err')의 1.96배를 더해서 상한 경계를 만드세요.
  • sns.FacetGrid()에 pollutant를 패싯 변수로 전달하고, 플롯들의 x축 연결을 해제해 구간이 보기 좋게 표시되도록 하세요.

  • 생성한 구간 경계를 매핑된 plt.hlines() 함수에 전달하세요.