1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Thống kê với R

Connected

Bài tập

Tìm ngoại lệ bằng IQR

Khoảng tứ phân vị (Interquartile Range, viết tắt IQR) là một cách khác để đo độ phân tán, ít bị ảnh hưởng bởi các giá trị ngoại lệ. IQR cũng thường được dùng để tìm ngoại lệ. Nếu một giá trị nhỏ hơn \(\text{Q1} - 1.5 \times \text{IQR}\) hoặc lớn hơn \(\text{Q3} + 1.5 \times \text{IQR}\), nó được xem là ngoại lệ. Thực tế, đây chính là cách tính độ dài "râu" trong biểu đồ hộp của ggplot2.

Diagram of a box plot showing median, quartiles, and outliers

Trong bài tập này, bạn sẽ tính IQR và dùng nó để tìm một số ngoại lệ. Cả hai thư viện dplyr và ggplot2 đã được nạp và food_consumption sẵn sàng sử dụng.

Hướng dẫn 1/3

undefined XP
    1
    2
    3
  • Tính tứ phân vị thứ nhất và thứ ba của co2_emission trong food_consumption và lưu lần lượt vào q1 và q3.
  • Tính khoảng tứ phân vị (IQR) của co2_emission và lưu vào iqr.