Menghapus objek duplikat
Misalkan Anda ingin membangun sebuah model prediktif untuk memilih donor yang paling mungkin merespons sebuah surat. Populasi basetable harus memuat donor yang memiliki alamat tersedia, dan yang pengaturan privasinya mengizinkan pengiriman surat.
Semua calon donor disediakan dalam sebuah dataframe donors dengan tiga kolom: donor_id, sebuah flag address yang bernilai 1 jika alamat tersedia dan 0 jika tidak, serta sebuah flag letter_allowed yang bernilai 1 jika donor dapat dikirimi surat dan 0 jika tidak.
Dalam latihan ini Anda akan membangun sebuah himpunan berisi donor yang seharusnya masuk ke dalam populasi.
Latihan ini adalah bagian dari kursus
Predictive Analytics Tingkat Menengah dengan Python
Petunjuk latihan
- Buat dataframe
donors_populationyang hanya memuat observasi dengan alamat tersedia dan yang diizinkan menerima surat. - Buat sebuah list yang berisi
donor_iddalamdonors_population. - Bangun populasi final dan kemudian jumlahkan donor di dalamnya.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]
# Create a list of donor IDs
population_list = ____(____["____"])
# Select unique donors in population_list
population = ____(____)
print(len(population))