Memeriksa hasil
Dalam latihan ini Anda akan memeriksa hasil model deteksi kecurangan DBSCAN Anda. Pada kenyataannya, sering kali Anda tidak memiliki label yang andal dan di sinilah analis fraud dapat membantu memvalidasi hasil. Ia dapat memeriksa hasil Anda dan melihat apakah kasus yang Anda tandai memang mencurigakan. Anda juga dapat memeriksa kasus-kasus yang secara historis sudah diketahui sebagai fraud dan melihat apakah model Anda menandainya.
Dalam kasus ini, Anda akan menggunakan label fraud untuk memeriksa hasil model Anda. Nomor klaster yang diprediksi tersedia pada pred_labels serta label fraud asli labels.
Latihan ini merupakan bagian dari kursus
Deteksi Kecurangan di Python
Instruksi latihan
- Buat sebuah dataframe yang menggabungkan nomor klaster dengan label aktual. Ini sudah dilakukan untuk Anda.
- Buat sebuah kondisi yang menandai fraud untuk tiga klaster terkecil: klaster 21, 17, dan 9.
- Buat sebuah crosstab dari label fraud aktual dengan label fraud prediksi yang baru dibuat.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Create a dataframe of the predicted cluster numbers and fraud labels
df = pd.DataFrame({'clusternr':pred_labels,'fraud':labels})
# Create a condition flagging fraud for the smallest clusters
df['predicted_fraud'] = np.where((df['clusternr']==21)|(____)|(____),1 , 0)
# Run a crosstab on the results
print(pd.crosstab(df['fraud'], df['____'], rownames=['Actual Fraud'], colnames=['Flagged Fraud']))