Eine Pipeline verwenden
Jetzt, wo du unsere Pipeline definiert hast – also eine logistische Regression mit einer SMOTE-Methode kombinierst –, lass sie auf den Daten laufen. Du kannst die Pipeline so behandeln, als wäre sie ein einzelnes Machine-Learning-Modell. Unsere Daten X und y sind bereits definiert, und die Pipeline wurde in der vorherigen Übung erstellt. Neugierig auf die Modellergebnisse? Probieren wir’s aus!
Diese Übung ist Teil des Kurses
<Kurs>Betrugserkennung mit Python</Kurs>Übungsanweisungen
- Teile die Daten
Xundyin Trainings- und Testmenge auf. Reserviere 30 % der Daten für den Test und setzerandom_stateauf 0. - Trainiere deine Pipeline mit den Trainingsdaten und erhalte die Vorhersagen, indem du
pipeline.predict()auf unserem DatensatzX_testausführst.
Interaktive praktische Übung
Versuche dich an dieser Übung, indem du diesen Beispielcode vervollständigst.
# Split your data X and y, into a training and a test set and fit the pipeline onto the training data
X_train, X_test, y_train, y_test = ____
# Fit your pipeline onto your training set and obtain predictions by fitting the model onto the test data
pipeline.fit(____, ____)
predicted = pipeline.____(____)
# Obtain the results from the classification report and confusion matrix
print('Classifcation report:\n', classification_report(y_test, predicted))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)