1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích Khám phá Dữ liệu với R

Connected

Bài tập

Nhận diện điểm ngoại lệ

Hãy xem phân phối tuổi thọ của các quốc gia ở châu Á như hình minh họa. Biểu đồ hộp cho thấy một điểm ngoại lệ rất rõ: một quốc gia có tuổi thọ đặc biệt thấp. Bạn đoán đó là quốc gia nào? Hãy kiểm tra phỏng đoán của bạn trong console bằng min() hoặc filter(), rồi tiếp tục tạo biểu đồ sau khi đã loại bỏ quốc gia đó.

Hướng dẫn

100 XP

gap2007 vẫn có sẵn trong không gian làm việc của bạn.

  • Áp dụng bộ lọc để chỉ giữ các quan sát từ châu Á, sau đó tạo biến mới tên is_outlier có giá trị TRUE cho các quốc gia có tuổi thọ nhỏ hơn 50. Gán kết quả vào gap_asia.
  • Lọc gap_asia để loại bỏ tất cả điểm ngoại lệ, rồi tạo một biểu đồ hộp khác cho các giá trị tuổi thọ còn lại.