1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Mô hình hóa Rủi ro Tín dụng bằng Python

Connected

Bài tập

Tìm ngoại lệ bằng bảng chéo

Giờ bạn cần tìm và loại bỏ các giá trị ngoại lệ có thể đang nằm trong dữ liệu. Với bài này, bạn có thể dùng bảng chéo và các hàm tổng hợp.

Hãy xem cột person_emp_length. Trước đây bạn đã dùng đối số aggfunc = 'mean' để xem giá trị trung bình của một cột số. Nhưng để phát hiện ngoại lệ, bạn có thể dùng các hàm khác như min và max.

Về mặt thực tế, một người khó có độ dài thời gian làm việc nhỏ hơn 0 hoặc lớn hơn 60. Bạn có thể dùng bảng chéo để kiểm tra dữ liệu và xem có trường hợp nào như vậy không!

Bộ dữ liệu cr_loan đã được nạp sẵn trong không gian làm việc.

Hướng dẫn 1/4

undefined XP
    1
    2
    3
    4
  • In bảng chéo giữa loan_status và person_home_ownership với giá trị person_emp_length lớn nhất.