MulaiMulai sekarang secara gratis

Pencarian kata dengan dataframe

Dalam latihan ini Anda akan bekerja dengan data teks yang berisi email dari karyawan Enron. Skandal Enron adalah kasus penipuan yang terkenal. Karyawan Enron menutupi kondisi keuangan perusahaan yang buruk, sehingga harga saham tetap tinggi secara artifisial. Karyawan Enron menjual opsi saham milik mereka sendiri, dan ketika kebenaran terungkap, para investor Enron tidak mendapatkan apa-apa. Tujuannya adalah menemukan semua email yang menyebut kata-kata tertentu, seperti "sell enron stock".

Dengan menggunakan operasi string pada dataframe, Anda dapat dengan mudah menyaring data email yang berantakan dan membuat penanda (flag) berdasarkan kemunculan kata. Data email Enron telah dimasukkan ke dalam sebuah dataframe bernama df, jadi mari kita cari istilah-istilah yang mencurigakan. Silakan jelajahi df di Konsol sebelum memulai.

Latihan ini adalah bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Find all cleaned emails that contain 'sell enron stock'
mask = df['clean_content'].____.____('____', na=False)
Edit dan Jalankan Kode