MulaiMulai sekarang secara gratis

Menggunakan klasifikasi ML untuk menangkap kecurangan

Dalam latihan ini, Anda akan melihat apa yang terjadi ketika Anda menggunakan model Machine Learning sederhana pada data kartu kredit kita.

Menurut Anda, bisakah hasil tersebut dikalahkan? Ingat, Anda telah memprediksi 22 dari 50 kasus kecurangan, dan memiliki 16 positif palsu.

Dengan itu sebagai acuan, mari kita terapkan model Logistic Regression. Jika Anda telah mengikuti kelas tentang supervised learning di Python, Anda seharusnya sudah akrab dengan model ini. Jika belum, Anda mungkin ingin meninjau kembali materi tersebut terlebih dahulu. Namun jangan khawatir, Anda akan dipandu melalui struktur model Machine Learning.

Variabel X dan y tersedia di workspace Anda.

Latihan ini adalah bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Petunjuk latihan

  • Bagi X dan y menjadi data latih dan data uji, dengan menyisihkan 30% data untuk pengujian.
  • Latih model Anda pada data latih.
  • Peroleh label prediksi model dengan menjalankan model.predict pada X_test.
  • Dapatkan klasifikasi dengan membandingkan y_test dengan predicted, dan gunakan confusion matrix yang diberikan untuk memeriksa hasil Anda.

Latihan interaktif praktis

Cobalah latihan ini dengan menyelesaikan kode contoh berikut.

# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)

# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)

# Obtain model predictions
predicted = model.predict(____)

# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)
Edit dan Jalankan Kode