Uso di una pipeline
Ora che hai definito la nostra pipeline, cioè combinare una regressione logistica con un metodo SMOTE, eseguiamola sui dati. Puoi trattare la pipeline come se fosse un singolo modello di Machine Learning. I nostri dati X e y sono già definiti, e la pipeline è stata definita nell’esercizio precedente. Sei curioso di scoprire i risultati del modello? Proviamoci!
Questo esercizio fa parte del corso
Rilevamento delle frodi in Python
Istruzioni dell'esercizio
- Suddividi i dati
Xeyin training set e test set. Metti da parte il 30% dei dati per il test set e impostarandom_statea zero. - Addestra la tua pipeline sui dati di training e ottieni le previsioni eseguendo la funzione
pipeline.predict()sul nostro insieme di testX_test.
Esercizio pratico interattivo
Prova a risolvere questo esercizio completando il codice di esempio.
# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____
# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data
pipeline.fit(____, ____)
predicted = pipeline.____(____)
# Obtain the results from the classification report and confusion matrix
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)