1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dữ liệu khám phá trong Python

Connected

Bài tập

Loại bỏ ngoại lệ (outlier)

Dù không phải lúc nào cũng nên loại bỏ ngoại lệ, nhưng trong phân tích này, bạn quyết định chỉ giữ các chuyến bay mà "Price" không phải là ngoại lệ.

Vì vậy, bạn cần tìm ngưỡng trên rồi dùng nó để loại bỏ các giá trị lớn hơn ngưỡng này khỏi DataFrame planes.

pandas đã được import sẵn là pd, cùng với seaborn là sns.

Hướng dẫn 1/4

undefined XP
  • 1
    • Tìm percentile thứ 75 và 25, lần lượt lưu là price_seventy_fifth và price_twenty_fifth.
  • 2
    • Tính IQR và lưu vào prices_iqr.
  • 3
    • Tính ngưỡng trên và ngưỡng dưới để xác định ngoại lệ.
  • 4
    • Loại bỏ các ngoại lệ khỏi planes.