Menggunakan pipeline
Sekarang setelah Anda memiliki pipeline yang didefinisikan, yaitu menggabungkan logistic regression dengan metode SMOTE, mari jalankan pada data. Anda dapat memperlakukan pipeline seolah-olah itu adalah satu model Machine Learning. Data X dan y sudah didefinisikan, dan pipeline didefinisikan pada latihan sebelumnya. Ingin tahu seperti apa hasil modelnya? Mari kita coba!
Latihan ini adalah bagian dari kursus
Deteksi Kecurangan di Python
Petunjuk latihan
- Bagi data 'X' dan 'y' menjadi himpunan pelatihan dan pengujian. Sisihkan 30% data untuk set pengujian, dan setel
random_stateke nol. - Pasang pipeline Anda pada data pelatihan dan peroleh prediksi dengan menjalankan fungsi
pipeline.predict()pada himpunan dataX_testkami.
Latihan interaktif praktis
Cobalah latihan ini dengan menyelesaikan kode contoh berikut.
# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____
# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data
pipeline.fit(____, ____)
predicted = pipeline.____(____)
# Obtain the results from the classification report and confusion matrix
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)