1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Nhập môn Phân tích Dự đoán với Python

Connected

Bài tập

Rời rạc hóa một biến cụ thể

Để vẽ predictor insight graphs cho các biến liên tục, trước hết bạn cần rời rạc hóa chúng. Trong Python, bạn có thể rời rạc hóa các cột của pandas bằng phương thức qcut.

Để kiểm tra liệu biến đã được rời rạc hóa hợp lý hay chưa, bạn có thể xác nhận rằng các bin có kích thước xấp xỉ bằng nhau bằng cách dùng phương thức groupby:

print(basetable.groupby("discretized_variable").size()

Hướng dẫn

100 XP
  • Dùng phương thức qcut để rời rạc hóa biến time_since_last_donation thành 10 nhóm. Gán biến này vào một cột mới tên là "bins_recency".
  • Dùng phương thức groupby để kiểm tra rằng các bin có kích thước gần như bằng nhau.