1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Python으로 시작하는 통계학

Connected

Bài tập

IQR로 이상치 찾기

이상치는 평균과 분산, 표준편차처럼 평균에 의존하는 통계량에 큰 영향을 줄 수 있어요. 사분위 범위(IQR)는 이상치의 영향을 덜 받는 또 다른 산포 척도입니다. IQR은 이상치를 찾을 때도 자주 사용돼요. 값이 \(\text{Q1} - 1.5 \times \text{IQR}\) 보다 작거나 \(\text{Q3} + 1.5 \times \text{IQR}\) 보다 크면 이상치로 간주합니다. 실제로 matplotlib의 박스 플롯에서 수염(whisker)의 길이도 이 규칙으로 계산돼요.

Diagram of a box plot showing median, quartiles, and outliers

이번 연습에서는 IQR을 계산하고 이를 사용해 일부 이상치를 찾아봅니다. pandas는 pd로, numpy는 np로 로드되어 있으며 food_consumption 데이터가 제공됩니다.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • 국가별로 그룹화하여 co2_emission의 합을 구해 국가별 총 co2_emission을 계산하세요. 결과 DataFrame을 emissions_by_country로 저장하세요.