Menggunakan pipeline
Sekarang setelah Anda memiliki pipeline yang didefinisikan, yaitu menggabungkan logistic regression dengan metode SMOTE, mari jalankan pada data. Anda dapat memperlakukan pipeline seolah-olah itu adalah satu model Machine Learning. Data X dan y sudah didefinisikan, dan pipeline didefinisikan pada latihan sebelumnya. Ingin tahu seperti apa hasil modelnya? Mari kita coba!
Latihan ini merupakan bagian dari kursus
Deteksi Kecurangan di Python
Instruksi latihan
- Bagi data 'X' dan 'y' menjadi himpunan pelatihan dan pengujian. Sisihkan 30% data untuk set pengujian, dan setel
random_stateke nol. - Pasang pipeline Anda pada data pelatihan dan peroleh prediksi dengan menjalankan fungsi
pipeline.predict()pada himpunan dataX_testkami.
Latihan interaktif langsung praktik
Cobalah latihan ini dengan melengkapi kode contoh ini.
# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____
# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data
pipeline.fit(____, ____)
predicted = pipeline.____(____)
# Obtain the results from the classification report and confusion matrix
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)