Eine Pipeline verwenden

Jetzt, wo du unsere Pipeline definiert hast – also eine logistische Regression mit einer SMOTE-Methode kombinierst –, lass sie auf den Daten laufen. Du kannst die Pipeline so behandeln, als wäre sie ein einzelnes Machine-Learning-Modell. Unsere Daten X und y sind bereits definiert, und die Pipeline wurde in der vorherigen Übung erstellt. Neugierig auf die Modellergebnisse? Probieren wir’s aus!

Diese Übung ist Teil des Kurses

<Kurs>Betrugserkennung mit Python</Kurs>

Kurs ansehen

Übungsanweisungen

Teile die Daten X und y in Trainings- und Testmenge auf. Reserviere 30 % der Daten für den Test und setze random_state auf 0.
Trainiere deine Pipeline mit den Trainingsdaten und erhalte die Vorhersagen, indem du pipeline.predict() auf unserem Datensatz X_test ausführst.

Interaktive praktische Übung

Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.

# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____

# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data 
pipeline.fit(____, ____) 
predicted = pipeline.____(____)

# Obtain the results from the classification report and confusion matrix 
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)

Code bearbeiten und ausführen