1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán nâng cao với Python

Connected

Bài tập

Loại bỏ đối tượng trùng lặp

Giả sử bạn muốn xây dựng một mô hình dự đoán để chọn ra các nhà tài trợ có khả năng phản hồi thư cao nhất. Population của basetable nên bao gồm những nhà tài trợ có sẵn địa chỉ và có cài đặt quyền riêng tư cho phép gửi thư. Tất cả nhà tài trợ ứng viên nằm trong dataframe donors với ba cột: donor_id, cờ address bằng 1 nếu có địa chỉ và 0 nếu không, và cờ letter_allowed bằng 1 nếu được phép gửi thư cho nhà tài trợ đó và 0 nếu không. Trong bài tập này, bạn sẽ tạo một tập hợp gồm các nhà tài trợ sẽ đi vào population.

Hướng dẫn

100 XP
  • Tạo dataframe donors_population chỉ chứa các quan sát có địa chỉ sẵn có và được phép gửi thư.
  • Tạo một list chứa các donor_id trong donors_population.
  • Xây dựng population cuối cùng và sau đó tính số lượng nhà tài trợ trong đó.