Memeriksa hasil
Dalam latihan ini Anda akan memeriksa hasil model deteksi kecurangan DBSCAN Anda. Pada kenyataannya, sering kali Anda tidak memiliki label yang andal dan di sinilah analis fraud dapat membantu memvalidasi hasil. Ia dapat memeriksa hasil Anda dan melihat apakah kasus yang Anda tandai memang mencurigakan. Anda juga dapat memeriksa kasus-kasus yang secara historis sudah diketahui sebagai fraud dan melihat apakah model Anda menandainya.
Dalam kasus ini, Anda akan menggunakan label fraud untuk memeriksa hasil model Anda. Nomor klaster yang diprediksi tersedia pada pred_labels serta label fraud asli labels.
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Buat sebuah dataframe yang menggabungkan nomor klaster dengan label aktual. Ini sudah dilakukan untuk Anda.
- Buat sebuah kondisi yang menandai fraud untuk tiga klaster terkecil: klaster 21, 17, dan 9.
- Buat sebuah crosstab dari label fraud aktual dengan label fraud prediksi yang baru dibuat.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create a dataframe of the predicted cluster numbers and fraud labels
df = pd.DataFrame({'clusternr':pred_labels,'fraud':labels})
# Create a condition flagging fraud for the smallest clusters
df['predicted_fraud'] = np.where((df['clusternr']==21)|(____)|(____),1 , 0)
# Run a crosstab on the results
print(pd.crosstab(df['fraud'], df['____'], rownames=['Actual Fraud'], colnames=['Flagged Fraud']))