Membuat flag
Kali ini Anda akan membuat variabel flag yang memberikan 1 ketika email cocok dengan istilah pencarian yang diminati, dan 0 jika tidak. Ini adalah langkah terakhir yang perlu Anda lakukan agar benar-benar dapat menggunakan konten data teks sebagai fitur dalam model machine learning, atau sebagai flag di atas hasil model. Anda dapat melanjutkan bekerja dengan dataframe df yang berisi email, dan daftar searchfor adalah yang didefinisikan pada latihan sebelumnya.
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Gunakan kondisi numpy where untuk memberi flag '1' ketika email yang telah dibersihkan memuat kata-kata dalam daftar
searchfordan 0 jika tidak. - Gabungkan kata-kata dalam daftar
searchfordengan indikator "or". - Hitung nilai dari variabel flag yang baru dibuat.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create flag variable where the emails match the searchfor terms
df['flag'] = ____.____((df['clean_content'].___.____('____'.____(____)) == True), 1, 0)
# Count the values of the flag variable
count = df['flag'].____()
print(count)