MulaiMulai sekarang secara gratis

Menghapus objek duplikat

Misalkan Anda ingin membangun sebuah model prediktif untuk memilih donor yang paling mungkin merespons sebuah surat. Populasi basetable harus memuat donor yang memiliki alamat tersedia, dan yang pengaturan privasinya mengizinkan pengiriman surat. Semua calon donor disediakan dalam sebuah dataframe donors dengan tiga kolom: donor_id, sebuah flag address yang bernilai 1 jika alamat tersedia dan 0 jika tidak, serta sebuah flag letter_allowed yang bernilai 1 jika donor dapat dikirimi surat dan 0 jika tidak. Dalam latihan ini Anda akan membangun sebuah himpunan berisi donor yang seharusnya masuk ke dalam populasi.

Latihan ini adalah bagian dari kursus

Predictive Analytics Tingkat Menengah dengan Python

Lihat Kursus

Petunjuk latihan

  • Buat dataframe donors_population yang hanya memuat observasi dengan alamat tersedia dan yang diizinkan menerima surat.
  • Buat sebuah list yang berisi donor_id dalam donors_population.
  • Bangun populasi final dan kemudian jumlahkan donor di dalamnya.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]

# Create a list of donor IDs
population_list = ____(____["____"])

# Select unique donors in population_list
population = ____(____)
print(len(population))
Edit dan Jalankan Kode