Hitung target teragregasi
Misalkan Anda ingin membangun model prediktif yang memprediksi donor mana yang paling mungkin menyumbang lebih dari 50 euro dalam bulan tertentu.
Diberikan sebuah basetable basetable yang sudah memiliki satu baris untuk setiap donor dalam populasi, kolom donor_id mewakili donor. Linimasa menunjukkan bahwa target harus bernilai 1 jika donor menyumbang lebih dari 50 euro pada Januari 2017 dan 0 jika tidak.
Dataframe pandas gifts_201701 memuat semua donasi pada Januari 2017. Dalam latihan ini Anda akan menambahkan kolom target ke basetable.
Latihan ini adalah bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Petunjuk latihan
- Bangun
gifts_summed, yang untuk setiap donor digifts_201701berisi jumlah donasinya. - Turunkan dari
gifts_summedsebuah listtargetsyang berisi donor yang menyumbang lebih dari 50 Euro pada periode target. - Tambahkan target ke basetable.
- Hitung dan cetak insidensi target.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Sum of donations for each donor in gifts_201701
gifts_summed = ____.groupby("____")["____"].____().reset_index()
# List with targets
targets = list(gifts_summed["id"][____["____"] > ____])
# Add targets to the basetable
basetable["target"] = pd.Series([____ if donor_id in targets else ____ for donor_id in basetable["donor_id"]])
# Calculate and print the target incidence
print(round(____["____"].____() / ____(____), 2))