MulaiMulai sekarang secara gratis

Memeriksa hasil

Dalam latihan ini Anda akan memeriksa hasil model deteksi kecurangan DBSCAN Anda. Pada kenyataannya, sering kali Anda tidak memiliki label yang andal dan di sinilah analis fraud dapat membantu memvalidasi hasil. Ia dapat memeriksa hasil Anda dan melihat apakah kasus yang Anda tandai memang mencurigakan. Anda juga dapat memeriksa kasus-kasus yang secara historis sudah diketahui sebagai fraud dan melihat apakah model Anda menandainya.

Dalam kasus ini, Anda akan menggunakan label fraud untuk memeriksa hasil model Anda. Nomor klaster yang diprediksi tersedia pada pred_labels serta label fraud asli labels.

Latihan ini adalah bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Petunjuk latihan

  • Buat sebuah dataframe yang menggabungkan nomor klaster dengan label aktual. Ini sudah dilakukan untuk Anda.
  • Buat sebuah kondisi yang menandai fraud untuk tiga klaster terkecil: klaster 21, 17, dan 9.
  • Buat sebuah crosstab dari label fraud aktual dengan label fraud prediksi yang baru dibuat.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create a dataframe of the predicted cluster numbers and fraud labels 
df = pd.DataFrame({'clusternr':pred_labels,'fraud':labels})

# Create a condition flagging fraud for the smallest clusters 
df['predicted_fraud'] = np.where((df['clusternr']==21)|(____)|(____),1 , 0)

# Run a crosstab on the results 
print(pd.crosstab(df['fraud'], df['____'], rownames=['Actual Fraud'], colnames=['Flagged Fraud']))
Edit dan Jalankan Kode