Menggunakan klasifikasi ML untuk menangkap kecurangan

Dalam latihan ini, Anda akan melihat apa yang terjadi ketika Anda menggunakan model Machine Learning sederhana pada data kartu kredit kita.

Menurut Anda, bisakah hasil tersebut dikalahkan? Ingat, Anda telah memprediksi 22 dari 50 kasus kecurangan, dan memiliki 16 positif palsu.

Dengan itu sebagai acuan, mari kita terapkan model Logistic Regression. Jika Anda telah mengikuti kelas tentang supervised learning di Python, Anda seharusnya sudah akrab dengan model ini. Jika belum, Anda mungkin ingin meninjau kembali materi tersebut terlebih dahulu. Namun jangan khawatir, Anda akan dipandu melalui struktur model Machine Learning.

Variabel X dan y tersedia di workspace Anda.

Latihan ini merupakan bagian dari kursus

Deteksi Kecurangan di Python

Lihat Kursus

Instruksi latihan

Bagi X dan y menjadi data latih dan data uji, dengan menyisihkan 30% data untuk pengujian.
Latih model Anda pada data latih.
Peroleh label prediksi model dengan menjalankan model.predict pada X_test.
Dapatkan klasifikasi dengan membandingkan y_test dengan predicted, dan gunakan confusion matrix yang diberikan untuk memeriksa hasil Anda.

Latihan interaktif langsung praktik

Cobalah latihan ini dengan melengkapi kode contoh ini.

# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)

# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)

# Obtain model predictions
predicted = model.predict(____)

# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)

Edit dan Jalankan Kode