1. 학습
  2. /
  3. 강의
  4. /
  5. Python으로 시작하는 통계학

Connected

연습 문제

IQR로 이상치 찾기

이상치는 평균뿐만 아니라 분산이나 표준편차처럼 평균에 의존하는 통계량에도 큰 영향을 줄 수 있습니다. 사분위범위(IQR)는 이상치의 영향을 덜 받는 또 다른 산포 측정 방법입니다. 또한 IQR은 이상치를 찾는 데 자주 사용됩니다. 값이 $\text{Q1} - 1.5 \times \text{IQR}\(보다 작거나 \)\text{Q3} + 1.5 \times \text{IQR}$보다 크면 이상치로 간주합니다. 실제로 matplotlib 상자그림의 수염도 이 기준을 사용해 계산됩니다.

중앙값, 사분위수, 이상치를 나타내는 상자그림 도식

이번 연습 문제에서는 IQR을 계산하고 이를 활용해 이상치를 찾아보겠습니다. pandas는 pd로, numpy는 np로 로드되어 있으며, food_consumption을 사용할 수 있습니다.

지침 1/4

undefined XP
    1
    2
    3
    4
  • 국가별 총 co2_emission을 계산하기 위해, 국가별로 그룹화한 뒤 co2_emission의 합계를 구하세요. 결과 DataFrame은 emissions_by_country에 저장하세요.