Menggunakan klasifikasi ML untuk menangkap kecurangan
Dalam latihan ini, Anda akan melihat apa yang terjadi ketika Anda menggunakan model Machine Learning sederhana pada data kartu kredit kita.
Menurut Anda, bisakah hasil tersebut dikalahkan? Ingat, Anda telah memprediksi 22 dari 50 kasus kecurangan, dan memiliki 16 positif palsu.
Dengan itu sebagai acuan, mari kita terapkan model Logistic Regression. Jika Anda telah mengikuti kelas tentang supervised learning di Python, Anda seharusnya sudah akrab dengan model ini. Jika belum, Anda mungkin ingin meninjau kembali materi tersebut terlebih dahulu. Namun jangan khawatir, Anda akan dipandu melalui struktur model Machine Learning.
Variabel X dan y tersedia di workspace Anda.
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Bagi
Xdanymenjadi data latih dan data uji, dengan menyisihkan 30% data untuk pengujian. - Latih model Anda pada data latih.
- Peroleh label prediksi model dengan menjalankan
model.predictpadaX_test. - Dapatkan klasifikasi dengan membandingkan
y_testdenganpredicted, dan gunakan confusion matrix yang diberikan untuk memeriksa hasil Anda.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)
# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)
# Obtain model predictions
predicted = model.predict(____)
# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)