Betrug mit ML-Klassifikation aufdecken

In dieser Übung siehst du, was passiert, wenn du stattdessen ein einfaches Machine-Learning-Modell auf unsere Kreditkartendaten anwendest.

Meinst du, du kannst die bisherigen Ergebnisse schlagen? Zur Erinnerung: Du hast 22 von 50 Betrugsfällen vorhergesagt und 16 False Positives erzeugt.

Mit diesem Ziel implementieren wir nun ein Logistic Regression-Modell. Wenn du den Kurs zu Supervised Learning in Python gemacht hast, kennst du dieses Modell bereits. Falls nicht, kannst du das jetzt kurz auffrischen. Keine Sorge, wir führen dich durch den Aufbau des Machine-Learning-Modells.

Die Variablen X und y stehen in deinem Workspace bereit.

Diese Übung ist Teil des Kurses

Betrugserkennung mit Python

Kurs anzeigen

Anleitung zur Übung

Teile X und y in Trainings- und Testdaten auf, wobei 30 % der Daten für den Test zurückgehalten werden.
Fitte dein Modell auf die Trainingsdaten.
Erhalte die vom Modell vorhergesagten Labels, indem du model.predict auf X_test anwendest.
Erzeuge einen Klassifikationsbericht, indem du y_test mit predicted vergleichst, und nutze die angegebene Konfusionsmatrix, um deine Ergebnisse zu prüfen.

Interaktive Übung

Vervollständige den Beispielcode, um diese Übung erfolgreich abzuschließen.

# Create the training and testing sets
X_train, X_test, y_train, y_test = train_test_split(____, ____, test_size=____, random_state=0)

# Fit a logistic regression model to our data
model = LogisticRegression()
model.fit(____, ____)

# Obtain model predictions
predicted = model.predict(____)

# Print the classifcation report and confusion matrix
print('Classification report:\n', classification_report(____, ____))
conf_mat = confusion_matrix(y_true=y_test, y_pred=predicted)
print('Confusion matrix:\n', conf_mat)

Code bearbeiten und ausführen