1. 학습
  2. /
  3. 강의
  4. /
  5. R로 시작하는 통계학 입문

Connected

연습 문제

IQR로 이상치 찾기

사분위 범위(IQR, interquartile range)는 이상치의 영향을 덜 받는 또 다른 산포 측도예요. IQR은 이상치를 찾을 때도 자주 사용합니다. 값이 $\text{Q1} - 1.5 \times \text{IQR}\(보다 작거나 \)\text{Q3} + 1.5 \times \text{IQR}$보다 크면 이상치로 간주해요. 사실 ggplot2의 상자그림(box plot)에서 수염(whiskers)의 길이도 이 규칙으로 계산됩니다.

Diagram of a box plot showing median, quartiles, and outliers

이번 연습 문제에서는 IQR을 계산하고 이를 사용해 몇 가지 이상치를 찾아볼 거예요. dplyr과 ggplot2 라이브러리는 이미 로드되어 있고 food_consumption 데이터가 준비되어 있습니다.

지침 1/3

undefined XP
    1
    2
    3
  • food_consumption의 co2_emission에 대해 첫 번째와 세 번째 사분위수를 계산하고 각각 q1, q3로 저장하세요.
  • co2_emission의 사분위 범위(IQR)를 계산하여 iqr로 저장하세요.