1. Học hỏi
  2. /
  3. Khoa Học
  4. /
  5. Phân tích dự đoán nâng cao với Python

Connected

Bài tập

Chênh lệch tuyệt đối giữa hai năm

Là một biến khác, bạn có thể muốn thêm độ chênh lệch tuyệt đối giữa số lượt quyên góp trong năm gần nhất (2017) và số lượt quyên góp của năm trước đó (2016). Để thêm biến này vào basetable, hai pandas dataframe gifts_2016 và gifts_2017 chứa các khoản quyên góp lần lượt của năm 2016 và 2017 đã được tạo sẵn cho bạn.

Nhớ rằng bạn có thể đếm số lần xuất hiện trong một pandas dataframe df cho từng id trong cột id bằng hàm groupby:

df_grouped = df.groupby("id")["value"].count().reset_index()

và bạn có thể left join hai dataframe df1 và df2 theo một merge_id cho trước bằng đoạn mã sau:

merged_df = pd.merge(df1, df2, on=["merge_id"], how="left")

Hướng dẫn

100 XP
  • Tính cho mỗi nhà tài trợ trong gifts_2016 số lượt quyên góp thực hiện trong năm 2016.
  • Tính cho mỗi nhà tài trợ trong gifts_2017 số lượt quyên góp thực hiện trong năm 2017.
  • Thêm số lượt quyên góp của năm 2016 và 2017 vào basetable.
  • Tính chênh lệch giữa số lượt quyên góp năm 2017 và năm 2016 trong basetable.