1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán nâng cao với Python

Connected

Bài tập

Xử lý ngoại lệ bằng winsorization

Cho một basetable với hai biến: "sum\_donations" và "donor\_id". "sum_donations có thể chứa các giá trị ngoại lệ khi nhà tài trợ đóng góp những khoản đặc biệt lớn. Vì vậy, bạn muốn winsorize biến này sao cho 5% giá trị cao nhất được thay thế bằng giá trị phần trăm 5% trên cùng.

Hướng dẫn

100 XP
  • In ra giá trị nhỏ nhất của sum_donations và kiểm tra rằng nó ít nhất là 0. Sau đó in ra giá trị lớn nhất của sum_donations.
  • Điền phần trăm giới hạn dưới phù hợp. Vì tất cả các giá trị lớn hơn 0 là hợp lý và xuất hiện thường xuyên, không cần thay thế các giá trị thấp hơn giá trị phần trăm giới hạn dưới.
  • Tạo biến mới "sum_donations_winsorized" là phiên bản đã winsorize của biến "sum_donations".
  • In ra giá trị lớn nhất của sum_donations_winsorized.