Mulai sekarangMulai gratis

Menghapus objek duplikat

Misalkan Anda ingin membangun sebuah model prediktif untuk memilih donor yang paling mungkin merespons sebuah surat. Populasi basetable harus memuat donor yang memiliki alamat tersedia, dan yang pengaturan privasinya mengizinkan pengiriman surat. Semua calon donor disediakan dalam sebuah dataframe donors dengan tiga kolom: donor_id, sebuah flag address yang bernilai 1 jika alamat tersedia dan 0 jika tidak, serta sebuah flag letter_allowed yang bernilai 1 jika donor dapat dikirimi surat dan 0 jika tidak. Dalam latihan ini Anda akan membangun sebuah himpunan berisi donor yang seharusnya masuk ke dalam populasi.

Latihan ini merupakan bagian dari kursus

Predictive Analytics Tingkat Menengah dengan Python

Lihat Kursus

Instruksi latihan

  • Buat dataframe donors_population yang hanya memuat observasi dengan alamat tersedia dan yang diizinkan menerima surat.
  • Buat sebuah list yang berisi donor_id dalam donors_population.
  • Bangun populasi final dan kemudian jumlahkan donor di dalamnya.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create a dataframe donors_population
donors_population = ____[(____["____"] == ____) & (____["____"] == ____)]

# Create a list of donor IDs
population_list = ____(____["____"])

# Select unique donors in population_list
population = ____(____)
print(len(population))
Edit dan Jalankan Kode