1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán nâng cao với Python

Connected

Bài tập

Một population tuân thủ timeline

Giả sử bạn muốn xây dựng một basetable cho mô hình dự đoán việc nhà tài trợ có quyên góp trong năm 2018 hay không. Timeline cho biết population phải bao gồm tất cả nhà tài trợ đã quyên góp ít nhất một lần kể từ ngày 1/1/2013, nhưng không có khoản quyên góp nào sau ngày 1/1/2017. Bạn được cung cấp một pandas dataframe gifts chứa mọi khoản quyên góp từ năm 2010. Trong bài này, bạn sẽ tạo một tập hợp gồm các donor id của tất cả nhà tài trợ thuộc population.

Hướng dẫn

100 XP
  • Tạo dataframe gifts_include chứa mọi khoản quyên góp từ năm 2013 trở đi và dataframe gifts_exclude chứa mọi khoản quyên góp từ năm 2017 trở đi.
  • Tạo tập hợp donors_include chứa tất cả donor id của các nhà tài trợ trong gifts_include và tập hợp donors_exclude chứa tất cả donor id của các nhà tài trợ trong gifts_exclude.
  • Xây dựng population bằng phương thức .difference() trên hai tập hợp của bạn.