Eine Pipeline verwenden
Jetzt, wo du unsere Pipeline definiert hast – also eine logistische Regression mit einer SMOTE-Methode kombinierst –, lass sie auf den Daten laufen. Du kannst die Pipeline so behandeln, als wäre sie ein einzelnes Machine-Learning-Modell. Unsere Daten X und y sind bereits definiert, und die Pipeline wurde in der vorherigen Übung erstellt. Neugierig auf die Modellergebnisse? Probieren wir’s aus!
Diese Übung ist Teil des Kurses
Betrugserkennung mit Python
Anleitung zur Übung
- Teile die Daten
Xundyin Trainings- und Testmenge auf. Reserviere 30 % der Daten für den Test und setzerandom_stateauf 0. - Trainiere deine Pipeline mit den Trainingsdaten und erhalte die Vorhersagen, indem du
pipeline.predict()auf unserem DatensatzX_testausführst.
Interaktive Übung
Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.
# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____
# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data
pipeline.fit(____, ____)
predicted = pipeline.____(____)
# Obtain the results from the classification report and confusion matrix
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)