Menjelajahi cara tradisional menangkap kecurangan

Dalam latihan ini, Anda akan mencoba menemukan kasus kecurangan pada himpunan data kartu kredit dengan cara "lama". Pertama, Anda akan menentukan nilai ambang menggunakan statistik umum untuk memisahkan kecurangan dan bukan kecurangan. Lalu, gunakan ambang tersebut pada fitur untuk mendeteksi kecurangan. Ini adalah praktik umum di tim analitik kecurangan.

Ambang statistik sering ditentukan dengan melihat nilai mean dari pengamatan. Mari mulai latihan ini dengan memeriksa apakah mean fitur berbeda antara kasus kecurangan dan bukan kecurangan. Selanjutnya, Anda akan menggunakan informasi tersebut untuk membuat ambang berbasis akal sehat. Terakhir, Anda akan memeriksa seberapa baik kinerjanya dalam deteksi kecurangan.

pandas sudah diimpor sebagai pd.

Latihan ini merupakan bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Instruksi latihan

Gunakan groupby() untuk mengelompokkan df berdasarkan Class dan peroleh mean dari fitur.
Buat kondisi V1 lebih kecil dari -3, dan V3 lebih kecil dari -5 sebagai kondisi untuk menandai kasus kecurangan.
Sebagai ukuran kinerja, gunakan fungsi crosstab dari pandas untuk membandingkan kasus kecurangan yang kita tandai dengan kasus kecurangan aktual.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Get the mean for each group
____.____(____).mean()

# Implement a rule for stating which cases are flagged as fraud
df['flag_as_fraud'] = np.where(np.logical_and(______), 1, 0)

# Create a crosstab of flagged fraud cases versus the actual fraud cases
print(____(df.Class, df.flag_as_fraud, rownames=['Actual Fraud'], colnames=['Flagged Fraud']))

Edit dan Jalankan Kode