Populasi yang sesuai linimasa
Misalkan Anda ingin membangun basetable untuk sebuah model prediktif yang memprediksi apakah donor akan berdonasi pada 2018. Linimasa menunjukkan bahwa populasi harus memuat semua donor yang berdonasi setidaknya sekali sejak 1 Januari 2013, tetapi tidak melakukan donasi setelah 1 Januari 2017.
Diberikan sebuah pandas dataframe gifts yang memuat semua donasi sejak 2010. Dalam latihan ini, Anda akan membangun sebuah himpunan berisi id donor dari semua donor dalam populasi.
Latihan ini adalah bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Petunjuk latihan
- Bangun dataframe
gifts_includeyang memuat semua donasi pada 2013 atau setelahnya dan dataframegifts_excludeyang memuat semua donasi pada 2017 atau setelahnya. - Bangun himpunan
donors_includeyang memuat semua id donor dari donor dalamgifts_includedan himpunandonors_excludeyang memuat semua id donor dari donor dalamgifts_exclude. - Bangun populasi menggunakan metode
.difference()pada kedua himpunan Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Gifts made in 2013 or later
gifts_include = ____[____[____].dt.year >= ____]
# Gifts made in 2017 or later
gifts_exclude = ____[____[____].dt.year >= ____]
# Set with ids in gifts_include
donors_include = ____(____[____])
# Set with ids in gifts_exclude
donors_exclude = ____(____[____])
# Population
population = ____.difference(____)
print(len(population))